10/12開催のセミナー資料を公開しました。
形態素解析からはじめるキーワード抽出(講師:打田智子 氏)
要旨:
自然言語処理やテキスト解析の実務への活用において、形態素解析と応用層(検索、テキスト分析、機械学習)の間に「用語抽出・素性抽出」という、地味で悩ましいタスクがあります。辞書整備、固有表現抽出、ターム抽出、キーフレーズ抽出など、様々なアプローチについて概観し、また利用できるツールや、活用例について紹介します。
自然言語処理やテキスト解析の実務への活用において、形態素解析と応用層(検索、テキスト分析、機械学習)の間に「用語抽出・素性抽出」という、地味で悩ましいタスクがあります。辞書整備、固有表現抽出、ターム抽出、キーフレーズ抽出など、様々なアプローチについて概観し、また利用できるツールや、活用例について紹介します。
講師紹介:
(株)ニューズピックスにて、経済ニュースプラットフォームの開発・運用・ユーザー行動分析に携わっています。検索/レコメンデーション/言語処理/テキスト解析に興味があります。Python製の形態素解析エンジンライブラリ janomeを開発しています。
共著:[改訂第3版]Apache Solr入門――オープンソース全文検索エンジン (Software Design plus)
セミナー資料: