2019-01-26 Andrew’s C/C++ Token Count Dataset 2016 C++ C プログラミング言語C/C++のトークン(記号・キーワード・識別子名など)出現頻度を調査したデータセット。約1.1万のOSSパッケージ/256万行のソースコードから5032万個のトークンを抽出。 (PDF) Andrew’s C/C++ Token Count Dataset 2016 (ACTCD16) http://www.tomazos.com/actcd16.txt.gz