ВИКОРИСТАННЯ МЕТОДІВ ЯКІСНОГО КОНТЕНТ-АНАЛІЗУ ДЛЯ ДОСЛІДЖЕННЯ ІМОВІРНІСНОГО РОЗПОДІЛУ КРИМІНАЛЬНО ЗНАЧИМОЇ ІНФОРМАЦІЇ НА НОВИННИХ ВЕБ-САЙТАХ
DOI:
https://doi.org/10.17721/2519-481X/2019/65-05Ключові слова:
якісний контент-аналіз; новинні веб-сайти; кримінально значима інформація; засоби масо-вої інформації; казахський, український і англійський текстові корпуси, словник криміналь-но-забарвлених термінів; методи machine learningАнотація
Сьогодні, в століття розвитку інформаційного суспільства, ЗМІ грають роль потужного засобу формування громадської думки і впливу на нього. Зараз усю інформацію можна знайти в текстовому виді в інтернеті, у тому числі і через ресурси соціальних медіа. Для аналізу такого роду даних краще всього застосовувати актуальну на сьогодні інформаційну технологію таку як контент-аналіз, який вивчає документи в їх соціальному контексті і використовується при дослідженні тематичної спрямованості засобів масової інформації. Завдяки розвитку методів контент-аналізу з'явилася можливість автоматичного дослідження змісту текстів, їх ефективності і оцінки впливу на суспільство. У цьому дослідженні проводиться аналіз існуючих підходів, методів і інструментів контент-аналізу, а також обгрунтовується актуальність дослідження можливостей використання широкого спектру лінгвістичних категорій для якісного контент-аналізу. Розглядаються концептуальні можливості використання цього виду аналізу в сучасних лінгвістичних і соціальних дослідженнях. У статті показано використання методів якісного контент-аналізу, підходів machine learning і розробленого словника кримінально забарвлених термінів на трьох мовах, що є одним з основних інструментів для дослідження розподілу кримінально значимої інформації новинних сайтів веб-медіа за географічними, часовими ознаками та категоріями злочинів. В дослідженні також пропонуються базові основи розробки інформаційної технології контент-аналізу новинного веб-простору певних географічних регіонів в часовій залежності за заданою тематикою, а саме по кримінальній картині регіону. В якості експериментального корпусу розглядаються тексти, що були зібрані автоматично, за допомогою розробленої програмного продукту, з новинних сайтів Казахстану, України, Великобританії і США.