10/28(金)に、found it project主催のセミナーを初開催しました。初回テーマは、Python × 機械学習 × 自然言語処理。
AIの研究に於いて、自然言語処理(NLP)はこれからますます注目度が高まる分野とも言われています。セミナー当日は、既に実務で使いこなしている方、経営者の方、Pythonをこれから学びたいという方まで幅広くご参加いただきました。
本ページでは当日の資料を公開しています!
第一部:Apache Sparkによる機械学習入門
第一部:Apache Sparkによる機械学習入門
第一部はMNU小峰央志さんの「Apache Sparkによる機械学習入門」
機械学習とはなにか?、機械学習アルゴリズムの例、Apache Sparkの概要について解説を頂いた後、
・小説の書き出し部分から著者を推定
・イチローの来年の打率推定
など、実践的な使い方もまじえてお話いただきました。
Apache Sparkによる機械学習入門第二部:Pythonと機械学習を使った文章の内容予測
第二部:Pythonと機械学習を使った文章の内容予測
第二部は辻真吾さんの「Pythonと機械学習を使った文章の内容予測」
今回はPythonの活用方法のなかでも、たくさんの文章をまとめて処理しながら意味をとる方法についてフォーカスした内容でした。
実際に当社データを一部参照しながらのカテゴリ予測を実践いただきました。MeCabで形態素解析したのち、Pythonのgensim・RandomForestを用いて分類をするだけでも、だいぶ精度が高い予測が出る!ということがわかりました。
02_Pythonと機械学習を使った文章の内容予測
辻さんは「Pythonスタートブック」(技術評論社)の著者で、この本は数あるPython入門本のなかでもとりわけ理解しやすいと評判です。これから勉強しようとしている方は、ぜひチェックしてみてください。
今後のセミナー情報も随時開催していきます。当セミナーにご興味ある方はぜひ、connpassのグループページからご参加ください!