自然言語処理のツール群

コラム

言語学の分野では、コンピューターによる解析を駆使して文章の構造や表現手法の特徴解析を行う自然言語処理システムを使った研究が盛んになっています。大学教員としては、学生が提出する論文やレポートの剽窃検出や、英文論文に使われる専門用語・専門的表現のトレンドの解析などにも使えるはずです。ベクトル解析言語のRやプログラミング言語のPythonを使うシステムが事実上の標準となりつつありますが、線型代数やプログラミングのスキルが実際に役に立つ典型的な例ではないでしょうか。

主に文系学部の学生諸君が必死に苦労してやってることだろうと思いますが、彼らが思うほどには、工学部の学生にとってもそれほど容易なことではないという実態は、憂うべきことです。経済学がほぼ理数系によって支配されている実態と比べて、工学系の学生にとって自然言語処理に進出することは決して難しいことではないはずなのに、活躍のチャンスを自ら失っているのは、実にもったいないことです。

これからの時代、テキストデータが信じられないほど大量に蓄積されていくことを思えば(ビッグデータ)、それをうまく解析して、隠れた有用な事実を引き出すスキルはマーケティングに必要不可欠になることでしょう(テキストマイニング)。社会のニーズを分析できないエンジニアなんて、生き残れませんぞ、学生の皆さん。

参考文献
978-4627848412 Rによるテキストマイニング入門
978-4873114705 入門 自然言語処理

コメント