同姓同名

言語処理で問題になるのは同姓同名。基本的に記事や論文からの自動識別には限界がある。論文の著者解析をするときも、同姓同名を自動では見分けるのが難しいため、論文登録時に研究者ID(ORCIDなど)を入力させる論文誌もある。

たとえば、2023年6月からNTTデータの社長は佐々木裕という方で私と同姓同名。読みも同じ。面識はない。1990年にNTTデータに入社されたということで、1988年にNTTに入社した私とはかなり経歴が近い。当時はNTTが人気No.1企業で、その年度の新卒採用者を成城の研修センターに全員集めて新人研修をしていた。同期にはミス東京もいたらしい。1988年に入社した際に、入社面接時の話では研究所かNTTのデータ部門(その後NTTデータに分社)のどちらかに配属になるという感触だった。国家公務員上級職(現I種)にも合格していたので、配属が研究所かデータのどちらかでなければ郵政省の郵貯関係の部署に移るつもりでいた。その後、運良くNTT基礎研究所(NTT CS基礎研)からマンチェスター大学を経て現職であるが、NTTデータに行っていたらもっと同姓同名が原因でいろいろ面倒なことになったかもしれない。話のタネに一度お会いしてみたい気もする。大学時代にも別の学年に同姓同名がいたので、結構知らないところも含めて、いろいろなところで同姓同名問題は起きているのかもしれない。