...
В таком случае коллектор нужно настроить следующим образом:
Code Block | ||
---|---|---|
| ||
collectors:
# файловые коллекторы
file:
# спецификация коллектора
switch:
# спецификация парсера для разбора прочитанных CDR
parser: plain/switch_2
# спецификации путей к файлам CDR
paths:
- directory: /var/cdr/ # путь к файлам с CDR
filename_pattern: ^cdr_\d+\.log$ # регулярное выражение, соответствующее формату имени файлов с CDR |
...
Для разбора файла такого вида используются следующие параметры конфигурации:
Code Block | ||
---|---|---|
| ||
parsers: plain: # спецификация парсера switch_2: cdr_delimiter: "\n" # разделитель между CDR в файле (символ новой строки) preprocessors: # предобработчики строки перед разбором - type: trim # обрезание краевых символов direction: left # край строки, возможные значения: left, right, both char: ' ' # символ - type: substring # взятие подстроки ('test' -> 'es') begin: 1 # начальная позиция (будет обрезан первый символ строки) end: -1 # конечная позиция (значение -1 означает, что подстрока будет взята до предпоследнего символа строки) records: - matcher: # регулярное выражение для разбора CDR на поля # 1 2 3 4 5 6 7 # trk_a station_a trk_b station_b day month year hour minute second dur status pattern: ^(\w+) (\d+|-)[^\s]* (\w+) (\d+)[^\s]* (\d{2}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}) (\d+) (\d+)$ fields: map: # соответствие полей CDR и строки, разобранной регулярным выражением # первое поле $g1, второе $g2 и т.д. # подстановка $g0 содержит всю строку trunk_a: $g1 station_a: $g2 trunk_b: $g3 station_b: $g4 call_datetime: $g5 duration_sec: int($g6) # приведение к целому числу termination_code: $g7 |
...