自然言語処理

MeCabをPythonで形態素解析 + FlaskでAPI

こんにちは、エクスペリエンスデザインセンターのsgi-changです。

今日は、MeCabをPythonで使って形態素解析をしてみます。

さらに音声認識の結果とかを渡せるよう、API化してみます。

以下の流れで進めていきたいと思います。

  • 形態素解析とは
  • MeCabとは
  • Flaskとは
  • 実装編

それでは、いざ、形態素解析の世界へ

続きを読む

fasttextとWatson Natural Language Classifierの文書分類比較

テクニカルエバンジェリストの井上(祐)です。

この記事は「CRESCO Advent Calendar 2019」24日目の記事です。

文章に書かれている内容から、どのカテゴリに分類するか判断を行う文書分類は、新聞記事のカテゴリ分類(政治、経済、スポーツなど)や、身近なところでは迷惑メールフィルタでの利用があります。また業務においては、大量に発生する文書、例えば契約書、提案書、日報、作業報告書などを効率よく分類することで業務効率化を図るなど様々な利用が考えれます。今回、文書分類器としてfasttext、Watson Natural Language Classifierを対象に分類精度、速度、費用について比較を行います。

続きを読む

Wikipediaの記事からサッカー日本代表を選んでみた

この記事は 『CRESCO Advent Calendar 2017』 16日目の記事です。

こんにちは、技術研究所のわたなべです。

突然ですが、今日12/16は大イベントがありますね!そう、クラブワールドカップの決勝戦です!

クラブワールドカップとは…

FIFA(国際サッカー連盟)が主催するサッカーの大会で、ヨーロッパ、アジア、オセアニア、北中米カリブ、南米、アフリカの各大陸チャンピオンと開催国代表の計7チームが集まる、世界最強のクラブを決める大会です。

昨年は日本で開催され、開催国代表である鹿島アントラーズ柴崎選手(当時)がスペインの強豪レアルマドリード相手に大活躍して話題になりました。

今年はアジアチャンピオンとして浦和レッズが出場しましたし、北中米カリブ代表パチューカに所属する本田圭佑選手も出場しました。
どちらも決勝まで進むことはできませんでしたが、熱い戦いを見せてくれましたね。

来年は(国別の)ワールドカップもありますし、サッカーがとても盛り上がっているなあと感じます。
そこで、今日は日本代表のベストイレブンをIT技術的な(特に私の専門の自然言語処理の)観点から導き出したいと思います!

続きを読む