...
В таком случае коллектор нужно настроить следующим образом:
| Code Block | ||
|---|---|---|
| ||
collectors:
# файловые коллекторы
file:
# спецификация коллектора
switch:
# спецификация парсера для разбора прочитанных CDR
parser: plain/switch_2
# спецификации путей к файлам CDR
paths:
- directory: /var/cdr/ # путь к файлам с CDR
filename_pattern: ^cdr_\d+\.log$ # регулярное выражение, соответствующее формату имени файлов с CDR |
...
Для разбора файла такого вида используются следующие параметры конфигурации:
| Code Block | ||
|---|---|---|
| ||
parsers:
plain:
# спецификация парсера
switch_2:
cdr_delimiter: "\n" # разделитель между CDR в файле (символ новой строки)
preprocessors:
# предобработчики строки перед разбором
- type: trim # обрезание краевых символов
direction: left # край строки, возможные значения: left, right, both
char: ' ' # символ
- type: substring # взятие подстроки ('test' -> 'es')
begin: 1 # начальная позиция (будет обрезан первый символ строки)
end: -1 # конечная позиция (значение -1 означает, что подстрока будет взята до предпоследнего символа строки)
records:
- matcher:
# регулярное выражение для разбора CDR на поля
# 1 2 3 4 5 6 7
# trk_a station_a trk_b station_b day month year hour minute second dur status
pattern: ^(\w+) (\d+|-)[^\s]* (\w+) (\d+)[^\s]* (\d{2}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}) (\d+) (\d+)$
fields:
map:
# соответствие полей CDR и строки, разобранной регулярным выражением
# первое поле $g1, второе $g2 и т.д.
# подстановка $g0 содержит всю строку
trunk_a: $g1
station_a: $g2
trunk_b: $g3
station_b: $g4
call_datetime: $g5
duration_sec: int($g6) # приведение к целому числу
termination_code: $g7 |
...