聯系人: 周杏會
所在地:
項目簡介:
隨著互聯網的快速發展,電子郵件已經成為了最普遍的應用,是人們的生活、學習和工作中必不可少的通訊工具。而在我們享受電子郵件帶給我們便利的同時,隨之而來的垃圾郵件卻給人們帶來了無盡的煩惱。身處大數據時代,信息傳播速度越來越快,郵箱郵件增速明顯,而這些郵件中,對于用戶而言,只有一兩封是自己真正需要的郵件,其他的便是垃圾郵件。這些垃圾郵件不僅給用戶帶來煩惱,而且清除起來特別麻煩。因此,通過研究反垃圾郵件技術,而其中最重要的是過濾技術,本軟件利用支持向量機(SVM)模型實現垃圾郵件的自動分類算法,作為反垃圾郵件的初步工作。
項目核心創新點:
本軟件基于支持向量機(SVM)模型,根據有限的樣本信息,訓練出一個具有最優性能的垃圾郵件自動分類系統。通過支持向量機模型,對郵件進行過濾,提高垃圾郵件的分類效果。
項目詳細用途:
軟件首先將數據集進行預處理,分為訓練集和測試集,對其進行分詞后,再提取訓練郵件數據的特征向量,由于郵件的內容過多,因此最關鍵的是要找出其主要的分類關鍵詞,在找出關鍵詞后就可以用這些關鍵詞對郵件進行特征標記。數據集使用現在廣泛使用的郵件數據集,郵件總數為500封,通過預處理之后選擇80%作為訓練數據,20%作為測試數據,將訓練數據使用SVM訓練,其中使用的核函數為高斯核函數,將訓練得到的模型使用測試數據進行測試,最后可以達到輸入一封郵件后,能正確輸出是屬于垃圾郵件還是正常郵件。