語の出現の偏りに基づく新たな隠語の発見

第5回 データ工学と情報マネジメントに関するフォーラム(DEIM2013)にて発表(学生プレゼンテーション賞受賞)。

概要

有害情報や違法行為を隠蔽しつつ情報伝達を行うために,Web上では日々新たな隠語が生まれており,こうした隠語の早期発見は犯罪防止や有害情報のフィルタリングに有用である.本研究では,隠語がアンダーグラウンド系掲示板に偏って出現することを利用して,新たな隠語を発見する手法を提案する.提案手法では,アンダーグラウンド系掲示板の新着記事から隠語候補を取得し,その語によるWeb検索結果とその記事をクラスタリングして,その記事が隠語が偏在するクラスタに入るかによって,語が隠語かを判定する.また,候補を探すべきアンダーグラウンド系掲示板も日々変わっていくため,新たな隠語の発見と新たな掲示板の発見を並行して行う.

関連資料

改訂版(6p)

DBSJ Journal vol.12 No.1(June 2013)に掲載。

results matching ""

    No results matching ""