2021-01-01から1年間の記事一覧

日本のIT音痴あるいはDX後進国ぶり

言語処理というより、広く情報系の教育についての話題です。コロナのまん延とともに、小中学校などでパソコンの貸し出しが行われています。オンライン授業に慣れるための予行演習をしているという感じです。もちろん、私立の小中学校などは昨年からタブレッ…

Zenodoを使ってGithubのレポジトリのDOIを取得

深層学習系の研究では、論文に記載した実験を行ったときのプログラム一式をGithub等で公開するのが普通になってきています。一方、Nature系の論文誌など自然科学系の論文誌では、プログラムコードを公開するだけでなくDOI(Digital Object Identifier)を付与…

レガシー

言語処理とは関係ない話題です。Windows 10になって、過去の機器が実は使えなくなっていることに気が付いた人も多いのではないでしょうか。 たとえば、いつのまにかSCSI機器やPCMCIAのカードなどの大部分動かなくなっています。Windows 7 までは XP のドライ…

miniconda

(以下は2021年5月6日時点の情報です.ライセンス条件は変更になる可能性があります.)Anaconda が商用利用とならない範囲で Anaconda 環境がどれぐらい使えるのかを確認してみた.なお,Anaconda3が既に導入されているWindowsに,minicondaをデフォルトの…

20年前の日本語QA

最近久しぶりにQAに関係した研究をしたので,日本語QA技術に関する歴史を紹介してみる.2001年に某研究所のオープンハウスにてQA技術を公開した.システム名はSAIQAである.この頃38才ぐらいなので一番エネルギーがあふれている頃.これは最初の実用的な日本…

htop

Unix系のtopコマンドは、プロセスの実行状況やCPU毎の負荷状態を見ることができて便利ですが、コア数(ハイパースレディング含む)が50ぐらいまでしか端末に表示できません。 96コア(192スレッド)のサーバーのCPU毎の状況は画面に収まりきらないため、どう…

備忘録~ .data[0] でエラーが出たとき

PyTorch 0.5 以降、ゼロ次元テンソルから値を取り出すには .data[0] ではなく .item() を使う。

知識グラフと言語処理

最近、知識グラフに関する研究に注目しています。知識グラフは、知識の断片を「主語ー述語ー目的語」の3つ組で表して、3つ組の集合として知識を記述する方法です。 このように3つ組にするということは、数学的には2項関係の集合として知識を書くこと、つまり…

GeForce RTX-3080

深層学習にGPUを使うのは常識になっていますが,GeForce RTX 3090はコア数が10,496、GPUメモリが24GB、GeForce RTX-3080はCUDAコア数が8,704,GPUメモリが標準で10GBあるので,深層学習用にはかなり使えます.良い世の中になりました.この調子なら,来年に…