DeepL

DeepLの翻訳の性能がさらに向上している.フランス語ー英語の翻訳を試したみると,ほとんどの文が普通に理解できる英語になって出てくる.以前,上手く訳せないといわれていた文も正しく訳せるようになっている.タイピングしながら(正しい)訳文が出てくるところがさらに良くできている.超伝導に関するフランス語の文も普通に読める英語になる.

https://www.deepl.com/translator

現在,日本語には対応していないが,もし日本語に対応したら,コンピュータ将棋で棋士が強くなったように,コンピュータ翻訳相手に英語を学ぶ時代が来るかもしれない.少し大げさになるが,英語教育のやりかた自体も見直す時期が来ているように思える.

言語処理学会2019プログラム編成

NLP2019の投稿件数が398件と過去最高になりました。投稿していただいた皆様ありがとうございました。

前回は332件でしたから、2割増ぐらいになっています。実際は今回からワークショップを本会議のテーマセッションに取り込んでいますので、実質は1割5分増ぐらいです。

言語処理業界がますます活発になっていることが裏付けられて嬉しい限りです。

現在2月7日のプログラム公開に向けて、非常にタイトなスケジュールの中で準備中ですので、今しばらくお待ちください。

チュートリアルと招待講演の日時は大会HPで既に公開しましたのでご参照ください。

自動走行講演

11月28日に国際会議JIST2018で自動走行オントロジーについての
招待講演をしてきました。

少しNLPを使った知識獲得の紹介もしてあります。現在、交通教則に交通関係のアノテーションをしていることろで、まだまだ品質が確保できていませんが、アノテーション自体は一周終わっています。

そのうち研究用に公開します。

Times Higher Education World University Rankings

THEのサーベイの依頼が今年も届いた。

普通に考えて、やはり大規模有名大学が有利な設問になっている。
前回候補になかった豊田工大が選択リストに入っているので、対象大学の更新はされているが、専門の狭い小規模大学は不利。たとえば、先進的な研究をしている大学を15挙げろといわれると、自然に大規模有名大学ばかりになってしまう。

NIPS

NIPSは今年で32回目の開催となる機械学習分野では歴史ある国際会議。ニューラルネットを中心テーマに据えている。

この会議の名前が物議をかもしているという。これまで特に問題になったという話は聞いていなかったが、NIPSという響が女性差別を助長するという意見があるという。

機械学習の会議」の略称が性差別に? AI業界に潜む多様性問題
https://wired.jp/2018/11/06/ai-researchers-fight-over-four-letters-nips/

当面は会議名称の変更の予定はないようだが、しばらく動向を注視したい。

皮膚科医vs人工知能

Annals of Oncology に5/28付けて興味深い論文が掲載された。

皮膚ガンの画像診断の正確性を医者とAIで比較すると、AIの方が性能が高かったと報告されている。

いろいろな比較をしていますが、一番分かりやすい比較は、皮膚ガン(メラノーマ)の診断の正確性を、100枚のテスト用画像を使って、世界中から参加した58人の皮膚科医とAIについて比較した結果です。皮膚科医のROC AUCスコアが0.79(±0.06)、AIが0.86でした。ROC AUCは高い程良く、最大が1になります。一般向けに非常にざっくり言えば、ROC AUCは画像から皮膚ガンを漏れなく正しく診断した割合です。経験5年以上の皮膚科医30人に絞ってスコアを計算すれば、ROC AUCスコアが0.82(±0.06)ですのでAIとの差はなくなります。

医療は専門外ですので、経験年数の多い皮膚科医でのスコアが0.82程度という結果は意外ですが、100枚の中には診断が難しい画像が含まれているようです。実際の診察では、他の様々な検査を組み合わせますので、画像だけでの診断だとこれぐらいということなのでしょう。中には病理検査をしないと分からないものもあるのかもしれません。診療情報や拡大画像を皮膚科医に提供すると、同スコアは58人全体でも0.82(±0.06)に改善しますのでAIとの有意差はなくなります。

AIは、GoogleのInception-v4という最新の畳み込みニューラルネット(CNN)を使っています。InceptionとResNetを導入したCNNで、画像分類において現在、世界トップレベルの性能を出しています。学習には100万枚以上の病名ラベル付きの画像を使っています。

詳しくは論文をご覧ください。
https://academic.oup.com/annonc/advance-article/doi/10.1093/annonc/mdy166/5004443

なお、本論文に関するニュース記事の中には、一部の目立つスコアをとってきて、AIが95%正解すると書いてあるものもありますが、ROC AUCのスコアで比べないと、あまり公平な比較になっていないと思います。