yohhoyの日記

技術的メモをしていきたい日記

Andrew’s C/C++ Token Count Dataset 2016

プログラミング言語C/C++トークン(記号・キーワード・識別子名など)出現頻度を調査したデータセット。約1.1万のOSSパッケージ/256万行のソースコードから5032万個のトークンを抽出。