2023-01-01から1年間の記事一覧
多くの人が認識している通り、2023年3月に発表されたGPT-4は世界に衝撃を与えた。2022年11月にGPT-3.5(ChatGPT)が発表された時点でも、一部世間で話題になっていたが、なんといってもGPT-4になってからのインパクトが大きい。業界の人間から見るとGPT-3.5も…
言語処理で問題になるのは同姓同名。基本的に記事や論文からの自動識別には限界がある。論文の著者解析をするときも、同姓同名を自動では見分けるのが難しいため、論文登録時に研究者ID(ORCIDなど)を入力させる論文誌もある。たとえば、2023年6月からNTTデー…
言語処理で問題になるのは同姓同名。基本的に記事や論文からの自動識別には限界がある。論文の著者解析をするときも、同姓同名を自動では見分けるのが難しいため、論文登録時に研究者ID(ORCIDなど)を入力させる論文誌もある。たとえば、2023年6月からNTTデー…
ChatGPTなどの生成言語モデルが話題になる少し前から、Transformerベースの深層翻訳システムが実用化されていた。翻訳も対話も入力に対する適切な文を生成するという点では同じであり、学習するデータが同じ言語か別の言語かの違いがあるだけだ。翻訳ソフト…
Symbolic-Neural Learning Workshopが,6/28-29に東京日本橋にある理研AIPで開催されました.コンピュータビジョン,音声,ロボティクス,自然言語処理,知識処理の関係者がバランスよく集まる良い研究交流の場となりました.その中で,Albert Gu先生が基調…
最近、AI業界では知識の表現に「知識グラフ(Knowledge Graph)」を用いた研究が流行っていて、うちの研究室でも使っています。 知識グラフは、知識を「主語ー述語ー目的語」の3つ組の集合で表現したものです。例えば、「リンゴの色は赤い」という知識は、(リ…
超電導に関する文献からの情報抽出の成果に関して、アジア国際研究賞2023「アジア優秀研究賞」に選ばれたようです。主催はインドの選定機関で、賞を受けるには6/9までに$225を支払う必要があるとのこと。まあ、そういうことです。常識的には、受賞というのは…
文には、表現のレベルと意味のレベルがあります。私たちが普段言葉を使っているときにこの2つレベルの違いは意識せずに自然に話をしていますが、この2つのレベルには明らかな違いがあり、かつこの2レベルは当然のことながらお互いに強く関係しています。表現…
続いてChatGPTの話題。GPT-3の登場あたりから、人間とコンピュータの対話(タイピングを通したチャット)が違和感のない文を通してできるようになったことで、この対話を通して、コンピューターは本当に分かって話しているのかどうかが議論になっている。た…
ひさしぶりに言語処理の話題です。GPT-4になっておかしな答えをすることも減ってきています。 まず ChatGPT とは何かを簡単に説明します。ChatGPTは、膨大な数の文書を学習データとして、どのような文が尤もらしいかを深層学習(Deep Learning)により学習し…
NLPとは全く関係ありませんが、未だにNexus7同等の7インチタブレットを見つけることができません。現時点での必須条件として、純正のAndroid 11以上、ディスプレイ7インチ、フルHD以上、メモリ4G以上、SIMスロットx2(e-SIMスロット含む)を想定しています。…
AMIA(American Medical Informatics Association: 米国医療情報学会)は、AMIA 25x5という活動を宣言しており、2022年から5年間で医師などが電子カルテ等の文書作成に要している労力を25%削減することを学会の活動目標として定めている。さらに、この活動を…