NO IMAGE
1 Star2 Stars3 Stars4 Stars5 Stars 給文章打分!
Loading...

本文是參考林鴻飛的《幽默計算及其應用研究》。

1、幽默計算

主要分為幽默識別幽默生成
幽默計算旨在賦予計算機識別、生成幽默的能力,它涉及資訊科學、認知語言學、心理學等多個學科的交叉。
對於幽默的界定並非易事,其內涵和外延涉及到語境認知、文化等諸多問題。
幽默是一種特殊的語義表達,幽默的理解通常需要在字面含義的基礎上,探索更深層次的語義內涵,可以考慮用深度學習的方法建立幽默計算模型,利用計算機自動識別生成幽默文字。

2、幽默的分類

語言中的幽默包含兩大類:言語幽默(verbal humor)和指稱性幽默(或稱概念性幽默Referential or conceptual humor)。
言語幽默是隻由語言本身產生的幽默,它依賴於詞和短語的語言特徵,產生諸如雙關語、歧義等幽默。例如,“胃大(偉大)的領導”、“蛤蟆跳井——不懂(撲通)”。這種幽默與文化和語言特徵緊密聯絡,很難在不同語言中進行翻譯。
指稱性幽默主要是指通過語言傳遞的幽默。它涉及某個場景或者事件,可以通過漫畫、視訊、文字、演講等各種媒介進行描述,並且能夠直接翻譯成其他語言,產生類似的效果。例如,“服務員,你的大拇指在湯裡了!”“沒關係,這湯一點也不燙。”。
言語幽默注重語言模態和語義淺層屬性,複雜性相對較低,而指稱幽默與語義、語用、邏輯等知識密切相連,具有更大的難度和挑戰性。

3、幽默的發展

幽默初期是以手工構造規則的方式,生成一些簡單的雙關語句子和小謎語等。
後來隨著機器學習效能的改善,以及詞彙獲取和本體語義等技術的進步,幽默實體和關係等資訊的獲取更加高效而準確,可以處理的資料規模進一步擴大,此階段基於統計的方法得到更多學者的青睞。
幽默智慧的提高需要對語義具有較為深刻的瞭解和細緻的描述。

4、幽默的語言學基礎

1、基本理論
幽默產生於同一語境下的語義衝突(或不協調),最早亞里士多德提出了乖訛理論,認為幽默產生於對同一陳述兩種不同解釋框架的混合,即期望與實際結果之間的差異通常是幽默的來源,並且這種不協調程度越大,越出其不意,幽默的效果就越強烈。

5、幽默生成

幽默生成一直以來都是一個巨大的挑戰,該過程需要對文化背景和上下文資訊進行充分考慮。當前幽默生成相關研究主要關注於生成固定模式的幽默框架或者基於雙關語表達的幽默生成機制。

研究和構建幽默框架的核心在於將幽默表達分解並轉化為非幽默表達,並在此基礎上深入理解幽默所傳達的情感資訊,在幽默生成中雙關語的構建是其核心所在,通過構建雙關語,在充分把握文字上下文的基礎上將非幽默表達轉化為幽默表達,是幽默生成研究的重點。

基於深度學習的幽默生成框架
幽默生成框架以直接形式的文字表達作為輸入,以具有相同含義的幽默文字表達作為輸出,在處理過程中通過使用指代替換和雙關語構建等方式將原始文字轉化為對應的具有幽默感的表達,從而實現幽默的生成過程。

深度學習方法可用於文字的深層語義表達,利用深度神經網路模型構建原始句子表達和候選幽默句子表達,通過計算兩者之間的匹配程度,定量的評估二者語義上的相似程度,同時通過幽默句子表達與現有幽默句子之間的相似度,評估候選幽默句子的幽默程度,權衡二者,選擇與原始文字在語義上最為接近且具有較高幽默感的句子作為系統的最終輸出。

相關文章

程式語言 最新文章