← До фільтрів та технологій

← До списку лабораторних по Python

Python Лабораторна 30: Парсинг логів через re

Технологія: Python

Номер лабораторної: 30 · Рівень: middle

Тема: Регулярні вирази

Повний опис / сценарій лабораторної:

Meta: навчитися будувати і тестувати регулярні вирази для аналізу логів та текстів.



Krok 1. Створити файл src/app/regex30.py.

Komandi: cd ~/python_lab1/src; touch app/regex30.py



Krok 2. Додати приклад рядка логу nginx у змінну.

Poyasnennya: наприклад ip, дата, метод, шлях і код статусу.



Krok 3. Побудувати регулярний вираз з іменованими групами ip, method, path, status.

Poyasnennya: використай re compile з raw рядком.



Krok 4. Застосувати вираз до прикладу і вивести словник з групами.



Krok 5. Обробити кілька рядків логів з файлу access30.log.

Poyasnennya: пройди по кожному рядку і парсь через regex.



Krok 6. Порахувати скільки запитів закінчилися кодом 500.



Krok 7. Винести шаблон регулярного виразу у окрему змінну і задокументувати його структуру коментарями.



Krok 8. Додати прості тести до regex через pytest які перевіряють очікуваний результат.



Krok 9. Занотувати обмеження regex і випадки коли краще використовувати парсер формату логів.



Krok 10. Mini zvit.

Zavdannya: опиши які шаблони логів у твоїй інфраструктурі найбільш критичні для аналізу.