文字

1/23ページ

文字資料的機器學習自動分類方法(上)

本文為第一部分,著重介紹文字預處理以及特徵抽取的方法。 隨著網際網路技術的迅速發展與普及,如何對浩如煙海的資料進行分類、組織和管理,已經成為一個具有重要用途的研究課題。而在這些資料中,文字資料又是數量最大的一類。“文字分類是指在給定分類體系下,根據文字內容自動確定文字類別的過程”(達觀資料科技聯合創 […]

《寫給24歲的自己》讀後感

24歲,面對自己人生的又一個轉折點。 看了《寫給24歲的自己》,最大的感想就是愛我所愛。 對自己所在的位置熱愛,熱愛接下來應該走下去的路。 有了熱情,才有堅持和努力的動力。 大學的四年,應該冷靜地思考如何度過。 是揮灑青春的年紀,更應該好好定位,找到自己想做的事和奮鬥的目標。

文字特徵抽取的向量空間模型(VSM)和TF/IDF方法

文字特徵抽取 兩組小說,一組是愛情的,另一組是科幻的。我們能否用支援向量機訓練一個模型,用來識別小說型別呢? 這個並不容易。因為支援向量機這類機器學習演算法只能接受數學裡面的向量作為輸入。如果用它來做文字分類,必須先把文字轉化成向量才行。這就是涉及到一個很重要的話題,如何把文字轉化成向量? 把文字轉 […]

我和文字“做愛”

  寫下這個題目,自己也覺得很俗,也很曖昧。“做愛”一詞是男女雙方兩情相悅而全身心投入做些靈魂激情的動作所達到那種妙不可言的高潮部分的感覺;敲下這個題目,我不是譁眾取寵,而是我對“文字”的敬畏,像情人的纖手輕輕拂過我殘缺的軀體有一種爆發的情感——寫作的衝動!在我生命裡沒有一個朋友,也沒一個紅顏知己向 […]

Ubuntu 16.04純文字介面、圖形化介面切換方法

一、圖形化介面與純文字介面的動態切換方法 Ubuntu 16.04系統預設以圖形化介面方式啟動,進入圖形化介面後,若要切換到純文字介面,一般可以按“Ctrl Alt F1(或F2-F6)”快捷鍵,在文字終端中輸入使用者名稱、密碼後登入即可,如下圖所示: 該方法的缺點是,如果安裝的是Ubuntu 16 […]

文字情感分析 python 正面和負面新聞 新浪微博 情感字典 機器學習

文字情感分析 從上一篇完成了對新浪微博的爬取,以及模擬登入的問題,小編又開始研究對微博文 本的正面和反面分析,從網上搜尋了好多方法,有機器學習和情感字典,可是機器學 習需要比較深的知識鏈,而小編還是小白,所以就選擇了情感字典方法。好了,直接 上程式碼嘛,直接可以執行的。 前提需要安裝相關的庫jieb […]