第148章 你們能比我更懂機器翻譯(5k)
你們只做了語料庫的擴展,規則覆蓋都沒有做,上下文依賴處理也沒有。
你們能比我更懂機器翻譯?”
林燃怒吼道:“你們做了九年都沒有進展,現在立刻馬上按照我說的去做!”
林燃的地位、實力和權力擺在這,他們根本沒有拒絕的選擇。
沃森會信林燃就不說了,畢竟深藍項目才結束,國防部的麥克納馬拉那更是林燃說什么就是什么。
你們這幫搞計算機的能比數學大師更懂計算機?
林燃在博弈論和統計學上展現出來的風采,麥克納馬拉還沒忘呢。
ibm的ceo支持林燃,國防部部長支持林燃,喬治敦大學的研究團隊只能被按在地上摩擦。
“我們要做的一共五點,優化算法和規則設計,擴充語料和詞匯,改進數據處理的效率,引入統計方法和硬件最大化利用。
其中改進數據處理效率和硬件最大化利用由ibm方面負責。
另外三點則由喬治敦大學的成員們負責。
我們先來談優化算法和規則設計。
你們一直的問題在于,你們對于規則集的擴張沒有引入更加細化的句法規則。
因為存儲有限,你們覺得擴充對照詞匯庫就夠了。
實際上句法規則顯得更加重要。
你們需要做到,引進常見的高頻句型。
對上下文進行依賴處理。使詞匯翻譯考慮前后詞,通過有限的上下文窗口來減少歧義。