aclpub備忘録

ACLのプロシーディングスを作成するには aclpub というツールキットを使う。ACL併設のワークショップのチェアをする場合、ワークショップで採録された論文をACL指定の形式で本の形の電子ファイルにするのは、ワークショップチェアの仕事となる(2007年5月現在)。

aclpub はSTARTサーバに投稿されたカメラレディとメタデータから、プロシーディングス印刷用のPDFファイル book.pdfを半自動で作成するためのツール。latexが動く環境が必要。

詳しくは aclpub/doc/bookchairs/index.html を参照。

1.ダウンロード
cvs -d :pserver:anoncvs@ftp.clsp.jhu.edu:/aclpub checkout aclpub

2.環境変数の設定
% export ACLPUB=[aclpubのディレクトリ]

3.作業用ディレクトリの作成
proceedings という名前のディレクトリを作成し、そこにカレントディレクトリを移し、
$ACLPUB/make/Makefile_bookchair を Makefile にコピーする。

4.カメラレディのダウンロード
STARTサーバにログインして、Manager Console→Monitor Final Submissions→Get Archiveで、proceedings/final.tgzに保存。

% make final

で、final.tgzを final ディレクトリの下に展開。
中身を一応確認。投稿番号のディレクトリの中にPDFファイルとメタデータが入っているはず。

5.perl モジュールのチェック
% make perl-modules
で必要なperlのモジュールが入っているかをチェック
入っていない場合は、
% perl -MCPAN -e shell
cpan> install モジュール名

6.コピーライトの情報をまとめる

% make copyright-signatures

7.dbファイルの作成
論文のタイトル、著者名等の情報を管理するためのファイルであるdbファイルを、STARTのメタデータから作成する。

このdbファイルは、手作業で修正しても良い。初期状態では、投稿番号順に並んでいるので、後に説明するorderファイルの順序にdbファイルの中のエントリを並べ替える。

8.ドラフトの作成

% make draft
% make view
でドラフトを作成し、中身を確認する。ドラフトはレイアウトを確認するためのものなので、ページ番号等は一致しない。

また、目次やプログラムは、make draftするたびに作成するか、現状のものを使うかを選択する。

もとのものを使うときには、

% touch toc.tex program.tex

新しくするためには、これらを削除してから make draftする。

9.orderファイルの作成

% make get-order

でorderファイルを作成し、下記の例のように編集する。

* Sunday, June 26, 2005
+ 8:45--9:00 Opening
+ 9:00--10:00 Invited Talk by Justine Cassell
+ 10:00--10:30 Break
= Session M1R: Machine Learning and Statistical Models
215 10:30--11:00 # Ando: A High-Performance Semi-Superv...
304 11:00--11:30 # Trevor: Scaling Conditional Random Fie...
382 11:30--12:00 # Smith: Logarithmic Opinion Pools for ...
= Session M1M: Word Sense Disambiguation
228 10:30--11:00 # Curran: Supersense Tagging of Unknown ...
124 11:00--11:30 # Kohomban: Learning Semantic Classes for ...
240 11:30--12:00 # Dang: The Role of Semantic Roles in ...
= Session M1B: Generation
245 10:30--11:00 # Di Eugenio: Aggregation improves learning:...
417 11:00--11:30 # Paiva: Empirically-based Control of N...
305 11:30--12:00 # Soricut: Towards Developing Generation ...
+ 12:00--1:30 Lunch
= Session Session M2R: Parsing
403 1:30--2:00 # Matsuzaki: Probabilistic CFG with latent ...
177 2:00--2:30 # Miyao: Probabilistic disambiguation m...
65 2:30--3:00 # McDonald: Online Large-Margin Training o...
60 3:00--3:30 # Nivre: Pseudo-Projective Dependency P...



10.ドラフトの再構成

% mv db db.old   ←(念のためにバックアップ)
% make draft

により、再度ドラフト版のbook.pdfを作成。

11.完成版の作成

% make shipout

により、最終版形式の book.pdf を作成。

12.表紙等を作成

現状ではデフォルトの表紙や前書きがついているので、texファイルを直接修正する。

titlepage.tex
copyright.tex
prefact.tex
toc.tex
program.tex
citation-stamp.tex
spine.tex

13.最終版

% make shipout

で再度作成。

14.CD-ROMデータの作成

metaファイルをエディタで作成し

% make CDROM

でCDROM用のデータを作成し、中身を確認。

15.提出用のデータの作成。

% make all

で proceeding.tgz を作成し、これをpublication chairに提出(ファイルサイズが多きので、メールで送らず、ダウンロードしてもらう)。

16.Tips

  • 論文の数が変わった場合は、allpapers.texをリネームして、再度作成しないと、結果が反映されないことがある。ページ番号等は、STARTのメタデータからdbファイルを作成する時点で決まるので、メタデータのない論文がもしあったとすると(STARTを通さずにメール等での投稿を受け付けた場合等)、エディタでメタデータを作るしかない(メタデータの作成は推奨されていない)。
  • preface.texのタイトルIntroductionはPrefaceに修正
  • メタファイルに書かれているLatin-1の文字は大体文字化けするので、手作業でlatex特殊文字に書き換える。たとえばŠは\v{S}に書き換える。これをしないと、Author Indexの名前が文字化けしたままになる。
  • aclpubを使ったことがある人が、完全なカメラレディのセットを対象に作業すると2〜3時間で作業が終わるが、実際には、著者に修正を依頼しないと修正できないものなどもあるため、レイアウトの修正などで1週間ぐらいの稼動を見込んだ方が安全。
  • 最後に make allする際に作られるtgzファイルは、proceedingsという名前のディレクトの中身になる。たとえばは proceedings-new というディレクトリの中でコマンドを打っても、../proceedingsのなかをtar&gzipするので注意が必要(2007/05現在)。