- 軟件大小:72.27M
- 軟件語言:中文
- 軟件類型:國(guó)產(chǎn)軟件
- 軟件類別:免費(fèi)軟件 / 編程工具
- 更新時(shí)間:2017-06-30 09:45
- 運(yùn)行環(huán)境:WinAll, WinXP, Win7, Win8
- 軟件等級(jí):
- 軟件廠商:
- 官方網(wǎng)站:http://ictclas.nlpir.org/
385.74M/中文/10.0
3.21M/中文/10.0
21.36M/中文/10.0
3.33M/中文/3.3
8.48M/中文/9.0
nlpir漢語分詞系統(tǒng)是一款適用于編程行業(yè)的中文分詞工具。本軟件支持詞性標(biāo)準(zhǔn)、關(guān)鍵詞提取的等功能。主要適用于漢語言詞法分析研究。本站提供的是最新版的icTCLas2016分詞系統(tǒng)安裝程序。需要的用戶歡迎在綠色資源網(wǎng)下載使用。
中國(guó)科學(xué)院計(jì)算技術(shù)研究所在多年研究工作積累的基礎(chǔ)上,研制出了漢語詞法分析系統(tǒng)ICTCLAS(InstituteofComputingTechnology,ChineseLexicalAnalysisSystem),主要功能包括中文分詞;詞性標(biāo)注;命名實(shí)體識(shí)別;新詞識(shí)別;同時(shí)支持用戶詞典。我們先后精心打造五年,內(nèi)核升級(jí)7次,目前已經(jīng)升級(jí)到了ICTCLAS2009用戶詞典接口擴(kuò)展用戶可以動(dòng)態(tài)增加、刪除用戶詞典中的詞,調(diào)節(jié)分詞的效果。提高了用戶詞典使用的靈活性。
ICTCLAS詞法分析系統(tǒng),從2009年開始,為了和以前工作進(jìn)行大的區(qū)隔,并推廣NLPIR自然語言處理與信息檢索共享平臺(tái),調(diào)整命名為NLPIR分詞系統(tǒng)。張華平博士先后傾力打造十余年,內(nèi)核升級(jí)十余次,先后獲得了2010年錢偉長(zhǎng)中文信息處理科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng),2003年國(guó)際SIGHAN分詞大賽綜合第一名,2002年國(guó)內(nèi)973評(píng)測(cè)綜合第一名。全球用戶突破30萬,包括中國(guó)移動(dòng)、華為、中搜、3721、NEC、中華商務(wù)網(wǎng)、硅谷動(dòng)力、云南日?qǐng)?bào)等企業(yè),清華大學(xué)、新疆大學(xué)、華南理工、麻省大學(xué)等機(jī)構(gòu):同時(shí),ICTCLAS廣泛地被《科學(xué)時(shí)報(bào)》、《人民日?qǐng)?bào)》海外版、《科技日?qǐng)?bào)》等多家媒體報(bào)道。您可以訪問Google進(jìn)一步了解ICTCLAS的應(yīng)用情況。
1.指紋提取
根據(jù)文章的內(nèi)容,結(jié)構(gòu),詞語間的關(guān)系,分析出能夠表示該文章的語義指紋,使用數(shù)字序列表示。
2.分詞粒度可調(diào)
可以控制分詞結(jié)果的粒度。共享版本提供兩種分詞粒度,標(biāo)準(zhǔn)粒度和粗粒度,滿足不同用戶的需求。
3.用戶詞典接口擴(kuò)展
用戶可以動(dòng)態(tài)增加、刪除用戶詞典中的詞,調(diào)節(jié)分詞的效果。提高了用戶詞典使用的靈活性。
4.詞性標(biāo)注功能加強(qiáng)
多種標(biāo)注級(jí)的選擇,系統(tǒng)可供選擇的標(biāo)注級(jí)有:計(jì)算所一級(jí)標(biāo)注級(jí),計(jì)算所二級(jí)標(biāo)注集,北大一級(jí)標(biāo)注集,北大二級(jí)標(biāo)注集。
5.關(guān)鍵詞提取
自動(dòng)抽取出能很好地代表文檔主題的若干個(gè)詞或短語。關(guān)鍵詞抽取技術(shù)廣泛應(yīng)用于信息檢索、文本分類/聚類、信息過濾、文檔摘要等各種智能文本信息處理領(lǐng)域,具有很好的應(yīng)用價(jià)值。
6.新詞發(fā)現(xiàn)與自適應(yīng)分詞功能
從較長(zhǎng)的文本內(nèi)容中,基于信息交叉熵自動(dòng)發(fā)現(xiàn)新特征語言,并自適應(yīng)測(cè)試語料的語言概率分布模型,實(shí)現(xiàn)自適應(yīng)分詞。
7.微博分詞功能:
對(duì)博主ID進(jìn)行nr標(biāo)示,對(duì)轉(zhuǎn)發(fā)的會(huì)話進(jìn)行自動(dòng)分割標(biāo)示(標(biāo)示為ssession),URL以及Email進(jìn)行自動(dòng)標(biāo)引。
請(qǐng)描述您所遇到的錯(cuò)誤,我們將盡快予以修正,謝謝!
*必填項(xiàng),請(qǐng)輸入內(nèi)容