會議記錄 文件 第75次會議記錄
作者: 陳彥榕 (07-26 17:04, 自動化新聞主題熱度排序系統.ppt ,329 KB) 閱讀 發表討論 列印 詳細資料
註解:

頂尖大學數位資訊發展計畫X-mind第七十五次會議紀錄

 

時間:99720

地點:大勇樓210402

參與人員:李蔡彥、廖文宏、蔡子傑、紀明德、陳百齡、陳聖智、鄭宇君及助理們。

請假:吳筱玫、劉吉軒、許瓊文、曾國峯、侯志欽、張寶芳、吳翠珍。

 

會議內容:

一、               行動傳播實驗平台計畫:

1.       行動傳播研究說明會將於7/21 () 7/22 ()晚上七點@大仁樓103教室。

 

二、               演講─自動化新聞探勘系統的實現:

Ø   自動化新聞探勘系統目標:

˙真實觀眾對新聞的想法

˙證明新聞得炒作

˙找出最有價值的潛在議題

˙個人化閱讀

 

Ø   資料探勘vs.學術研究:

˙即時vs.區間

˙全體vs.抽樣

˙個體vs.分類

˙自動化vs.操作

 

Ø   群眾/工人智慧vs.人工智慧

1.      每個人對任一些事都有些想法

2.      這些想法會有一些行為

3.      把所有的行為記錄起來計算處理

4.      找到一定結論&趨向

5.      套用在未知的事件或回溯分析

6.      建立一套使用者可用的系統

7.      使用者得記錄可回饋到步驟3

 

Ø   系統架構與流程

1.      Blog觀察發散貼紙

2.      部觀門蒐集使用者的Refer

3.      (a)計算每日的關鍵字並列入詞庫

(b)計算出爆衝的關鍵字以plurk提醒工作人員列入詞庫

4. (a)從其他搜尋引擎意見找出最新的關鍵字

(b)人工加入

(c)利用微網誌的特性萃取出關鍵字

5. 收集blogplurk等來源之RSS與詞庫

 

Ø   新議題/關鍵字的問題

 

Ø   疊代式泡沫關鍵字萃取法:

1.      關鍵字越尋常越重要、搜尋次數越多

2.      關鍵字字串長度越小,代表的意義也越廣

 

Ø   關鍵字閱讀:

˙移動平均(最高峰、時間週期、迴歸分析、成長率、熱門度、總量、爆炸度、持續度、週期度)

 

Ø   時間序列分析:

˙ARIMA預測

˙無母體(經驗法則)

˙週期性

˙傅立葉DFTFFT

 

Ø   新聞議題的調校

˙關鍵字不為議題

˙相關議題不同關鍵字

 

Ø   老師們與講者的Feedback:

1.      系統計算&server問題

2.      可算出plurk發佈&回應之密度、交流情形

3.      Censorà用手機記錄個人生活型態

4.      與講者合作的可能性:UI改善(資科與傳院合作)