您現(xiàn)在的位置: 中國科技創(chuàng)新網(wǎng) > 文章中心 > 論文在線 > 文章正文

段文潤1 段之宓2  段琦麗3

(1.四川大學(xué)外國語學(xué)院,610064;2.中國電子科技集團(tuán)公司第十研究所,成都,610036;

3.中國電信成都分公司  610051)

摘要: 本文提出了隱詞形這一計算語言學(xué)的新概念,并基于此概念建立了隱詞形語法。隱詞形理論要求應(yīng)將作為代數(shù)系生成元集的自然語言的詞的集合,按照其出現(xiàn)的言語語境,劃分為最小等價類子集。因而,作為構(gòu)句基礎(chǔ)元素的隱詞形在句法功能和語義上便是無歧義的,而隱詞形語法規(guī)則便是帶有語義和語境信息的語法。這種語法曾用在我們的機(jī)器翻譯試驗系統(tǒng)JX—1上,并證明具有很強(qiáng)的排歧功能。

關(guān)鍵詞:隱詞形,隱詞形語法,等價類子集,言語語境,排歧,機(jī)器翻譯,統(tǒng)計方法

中圖分類號:H03,TP301.2   文獻(xiàn)標(biāo)識碼: A 

Abctract: In this paper we provided a new formalized conception of computer linguistics—potential wordform, and  on the basis of this conception we built a potential wordform grammar. The theory of potential wordform requires that words of national language, as the set of generative elements of a algebraic system, should be divided into minimum equivalence class subsets according to the speech situation where the words appear. Therefore, the potential wordform, as the fundamental element of sentence building, is disambiguous in its syntactic function and semantics, and the potential wordform grammar is a grammar with sematics and situation informations. The grammar was applied in our experimental machine translation system JX—1 and was proved to be a grammar highly effective in disambiguation .

Key words: potential wordform, potential wordform grammar, equivalence class set, speech situation, disambiguation, machine translation, statistical method 

1. 機(jī)器翻譯歷史及現(xiàn)狀評論

機(jī)器翻譯始自上世紀(jì)四十年代,已有60余年的歷史。目前正進(jìn)入初步實用階段(如國外的Eurotran系統(tǒng)及國內(nèi)的若干上市軟件)。所謂初步實用,離真正的實用還很遠(yuǎn)。目前,各系統(tǒng)對簡單句及受限文本(如可“對齊”語句)的翻譯尚可,而對復(fù)雜長句及非受限文本(如不能“對齊”的語句)的處理則僅僅處于起步階段。后者的質(zhì)量,若按外語專業(yè)的標(biāo)準(zhǔn)打分(目前尚無權(quán)威的國際測試標(biāo)準(zhǔn))只能達(dá)到30—40%的合格率。提高質(zhì)量的瓶頸在于語言知識的粒度不夠細(xì),從而不能有效排除歧義。對于“細(xì)度”問題,上世紀(jì)70年代末—80年代,即曾提出過“格語法”(Fillmore)[1]、“廣義短語結(jié)構(gòu)文法”(Gerald Gazdar)、“詞匯—功能語法”(Bresnan及Kaplan)、“功能合一語法”(M.Kay)、“多叉多標(biāo)記樹”(馮志偉)[2]以及《現(xiàn)代漢語語法信息辭典詳解》(俞士汶等人)[3]等理論和著作。這些理論重視詞匯及短語的“復(fù)雜特征”(即“細(xì)度”),為機(jī)器翻譯可預(yù)期的商業(yè)實用指明了正確的道路。然而,它們在具體的理論闡述與工程實施上,過多地把注意力放到了復(fù)雜特征知識的表達(dá)(如特征矩陣、多叉多標(biāo)記樹等)及相關(guān)的演算(如非循環(huán)有向圖、合一運算等)上。對復(fù)雜特征應(yīng)是一些什么特征及它們的排歧機(jī)制本身反倒重視不夠。此后流行的語料庫語言學(xué)及統(tǒng)計方法(馬爾科夫隨機(jī)過程、信息熵等)為機(jī)器翻譯所需之詞匯及語法知識的獲取開辟了半自動化的道路,也為機(jī)器詞典的義素化打下了基礎(chǔ)(如普林斯頓的Wordnet[4]、董振東的Hownet)。然而,對復(fù)雜特征本身應(yīng)如何全面細(xì)化及各特征的排歧機(jī)制仍缺乏商用性的貢獻(xiàn)。統(tǒng)計排歧的詞類幾乎僅是傳統(tǒng)語法的詞類,而義素詞典也還不能完全適應(yīng)詞義排歧的需要,不能有效解決機(jī)譯中的排歧問題。因此,語言知識粒度的細(xì)化及其排歧機(jī)理的研究,至今仍是有待突破的瓶頸。我們在上世紀(jì)80年代末也曾獨立提出了基于復(fù)雜特征的“隱詞形論”框架[5],此后在一次受限詞典與受限句型的英—漢機(jī)譯試驗(JX—1系統(tǒng))的實踐中又對此理論進(jìn)行了具體化和充實。實踐證明,“隱詞形論”在排除歧義、提高機(jī)譯質(zhì)量方面取得了明顯的效果,有必要進(jìn)一步研究充實,形成詞典和語法,以便用於語言工程。

 

  2. 隱詞形論簡述  3. 隱詞形的知識表達(dá),獲取與運用

 

參考文獻(xiàn):

1.  Charles J Fillmore. 格辨[A].語言學(xué)譯叢(第2輯)[C].北京:社科院出版社.1980.

2.馮志偉. 機(jī)器翻譯研究 [M]. 中國對外翻譯出版公司. 2004

3.俞士汶等.現(xiàn)代漢語語法信息詞典 [M]. 北京:清華大學(xué)出版社.1998

4.Cognitive Science Laboratory at Princeton University.WordNet-1.7.1[EB/OL].http://www.cogsci.princeton.edu/~wn/,2004-05-10

5. 段文潤.俄語簡單句句型的“群”描寫——數(shù)理語言學(xué)的一種代數(shù)方法[A],科學(xué)的整體化趨勢[C]. 成都:四川大學(xué)出版社.1989

6.  Richard Montague. Universal grammar[A], ”Formal Philosophy”, Selected Papers of Richard Montague[M].Yale University Press.1979

7. 趙元任.漢語口語語法[M].商務(wù)印書館.1979

8. 段綺麗.機(jī)器翻譯中詞義的常識排岐[A].重慶大學(xué)學(xué)報 [J ],2005,28(3):69-71

9.  Русская Грамматика. Академия Наук СССР, Институт Русского Языка, Издательство Наука .1980

10. F. de Saussure,Cours de linguistigue generale,[M] .Paris,1972 .Курс  Общей лингвистики ,Русское издание

11.  Chomsky , N.  Aspects of the Theory of Syntax [M]. Cambridge,Mass,The MIT Press. 1965

12.  段鷹,荷芒. 機(jī)器翻譯中的一種狀態(tài)空間搜索方法[J]. 重慶大學(xué)學(xué)報,2006,29(3):99-102

13. 段鷹,段文澤. 一類相關(guān)對象組合的解耦遞階智能搜索. 中國科技創(chuàng)新網(wǎng),論文在線: /Article/ShowArticle.asp?ArticleID=2644

14.黃昌寧,夏瑩主編. 語言信息處理專論 [M]. 北京:清華大學(xué)出版社,廣西科學(xué)技術(shù)出版社.1996

15. 段綺麗,段之宓. 機(jī)器翻譯中自然語言的梯級表示模型[A].機(jī)器翻譯研究進(jìn)展[C].北京:電子工業(yè)出版社,2002

文章錄入:zgkjcx    責(zé)任編輯:zgkjcx 
  • 上一篇文章:

  • 下一篇文章:
  •  
    名稱:科技創(chuàng)新網(wǎng) 工信部備案號:京ICP備13040577號-2    公安備案號:11010802029847
    版權(quán)所有:未經(jīng)授權(quán)禁止復(fù)制或建立鏡像 E-Mail:zgkjcx08@126.com
    主站蜘蛛池模板: 思思久久99热只有频精品66| 美女网站在线观看视频免费的| 婷婷色在线观看| 久久综合国产乱子伦精品免费| 波多野结衣一区二区三区高清av| 国产av午夜精品一区二区入口| 亚洲综合在线另类色区奇米| 天堂在线www| 中文字幕在线观看一区二区| 日韩精品一区二区三区在线观看 | 欧洲亚洲国产精华液| 人妻妺妺窝人体色WWW聚色窝| 色狠狠久久av五月综合| 国产成人综合美国十次| 2019天堂精品视频在线观看| 夜夜躁日日躁狠狠久久av| 一级毛片一级毛片一级毛片aaav | 久久不见久久见免费影院www日本| 樱花草www日本在线观看| 亚洲欧美日韩电影| 狠狠色综合网站久久久久久久高清 | 小兔子被蛇用两根是什么小说| 久久99精品久久久久久hb无码| 日韩精品欧美亚洲高清有无| 亚洲中久无码永久在线观看同| 欧美精品寂寞影院请用uc| 伊人久久波多野结衣中文字幕| 精品国产三上悠亚在线观看| 四虎色姝姝影院www| 被合租粗糙室友到哭| 国产女人视频免费观看| 中文乱码字幕午夜无线观看| 国产精品理论电影| 91香蕉视频在线| 在线视频第二页| aa在线免费观看| 女人18毛片一级毛片在线| 一区二区三区在线|欧| 性色欲网站人妻丰满中文久久不卡 | 国产成年无码久久久免费| 亚洲伊人久久网|