恭喜匯世國(guó)際書院師生在國(guó)際期刊International Journal of Education and Technology發(fā)表文章
來源:匯世國(guó)際書院
時(shí)間:2021-09-29
9月28日,匯世國(guó)際書院Freddy老師計(jì)算機(jī)人工智能算法課題組指導(dǎo)的學(xué)生張夢(mèng)妮、李宇粲、李鍇等同學(xué)在國(guó)際知名期刊《International Journal of Education and Technology》上發(fā)標(biāo)題為“Improvement of English Text Recognition Algorithm Based on HMM”的科研創(chuàng)新文章。該文章針對(duì)傳統(tǒng)的基于HMM的英文文本識(shí)別算法的不足,設(shè)計(jì)了一種混合模型的英文文本識(shí)別算法?;旌夏P退惴ňC合了多種英文文本識(shí)別方法,添加支持向量機(jī)對(duì)文本進(jìn)行分類,使用S型函數(shù)對(duì)模型參數(shù)進(jìn)行擬合和調(diào)整,并采用了數(shù)據(jù)平滑技術(shù)對(duì)模型的概率空間進(jìn)行優(yōu)化。
由于自然語言的多樣性和不確定性,自然語言的信息提取逐漸從傳統(tǒng)的基于詞典或規(guī)則的方法轉(zhuǎn)變?yōu)闄C(jī)器學(xué)習(xí)方法。然而,現(xiàn)有的算法在文本識(shí)別中準(zhǔn)確率較低,特別是為了提高文本識(shí)別的準(zhǔn)確率,需要學(xué)習(xí)大量的訓(xùn)練樣本。本文結(jié)合傳統(tǒng)文本識(shí)別算法的優(yōu)點(diǎn),引入支持向量機(jī)和統(tǒng)計(jì)相關(guān)技術(shù)對(duì)其進(jìn)行改進(jìn),提出的基于混合模型的文本識(shí)別算法與基于多元HMM和二階HMM的文本識(shí)別算法相比,該算法具有更高的準(zhǔn)確率和學(xué)習(xí)效率。
實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)結(jié)果表明,該文章提出的基于混合模型的英文文本識(shí)別算法不僅提高了英文文本識(shí)別的準(zhǔn)確率和召回率,而且在不學(xué)習(xí)大量訓(xùn)練樣本的情況下,對(duì)含有一定結(jié)構(gòu)化信息的文本實(shí)現(xiàn)了較高的識(shí)別準(zhǔn)確率。
Freddy老師為本文的通訊作者。AS年級(jí)的李宇粲同學(xué)主要從事研究、改進(jìn)算法理論的設(shè)計(jì)和數(shù)學(xué)問題的解決,AS年級(jí)的李鍇同學(xué)主要負(fù)責(zé)收集數(shù)據(jù)完成本文的編碼實(shí)現(xiàn),IG年級(jí)的張夢(mèng)妮同學(xué)則主要負(fù)責(zé)全文的英文撰寫。值得一提的是,盡管AS年級(jí)的幾位同學(xué)學(xué)業(yè)繁忙,同期還要進(jìn)行十月份的本科大學(xué)申請(qǐng)準(zhǔn)備工作,但是該文章從起草到發(fā)表歷時(shí)的整個(gè)過程,這些同學(xué)都能夠有效地在學(xué)術(shù)科研和備考申請(qǐng)之間進(jìn)行巧妙平衡,這充分體現(xiàn)了匯世學(xué)子的科研主觀能動(dòng)性和自我協(xié)調(diào)學(xué)習(xí)能力。
更多廣東國(guó)際學(xué)校相關(guān)資訊,可到本網(wǎng)站查看!
匯世國(guó)際書院 · 預(yù)約看校
上一篇:木有更多了