自然語(yǔ)言處理的基礎(chǔ)是各類(lèi)自然語(yǔ)言處理的基礎(chǔ)是各類(lèi)自然語(yǔ)言處理數(shù)據(jù)集,如tc-corpus-train(語(yǔ)料庫(kù)訓(xùn)練集)、面向文本分類(lèi)研究的中英文新聞分類(lèi)語(yǔ)料、以IG卡方等特征詞選擇方法生成的多維度ARFF格式中文VSM模型、萬(wàn)篇隨機(jī)抽取論文中文DBLP資源、用于非監(jiān)督中文分詞算法的中文分詞詞庫(kù)、UCI評(píng)價(jià)排序數(shù)據(jù)、帶有初始化說(shuō)明的情感分析數(shù)據(jù)集等。