久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

10款數(shù)據(jù)分析“工具”,,助你成為新媒體運(yùn)營領(lǐng)域的“增長黑客”(下)

 小麥屠豬館 2017-06-06

不必羨慕什么“技術(shù)流”,,即使是不懂技術(shù)和復(fù)雜數(shù)學(xué)知識的你,照樣能成為新媒體運(yùn)營領(lǐng)域的“增長黑客”,!因為創(chuàng)造性思維和強(qiáng)烈的好奇心會給你帶來好運(yùn)的,,等到工具、技能和思維三者融會貫通的時候,,就會像獨(dú)孤求敗那樣-“不滯於物,,飛花草木皆可傷人,草木竹石均可為劍”,!


上篇推薦:《10款數(shù)據(jù)分析“工具”,,助你成為新媒體運(yùn)營領(lǐng)域的“增長黑客”(上)》

4 可視化工具

俗話說:“文不如字,字不如表,表不如圖”,一張富含信息量且外觀時尚靚麗的圖會給文章增色不少,,會激起讀者的好奇心,,不知不覺的去圖片中探尋信息,從而讓文章的可讀性大大增加,,易于傳播,。比如這張圖:

人人都是產(chǎn)品經(jīng)理網(wǎng)站“產(chǎn)品經(jīng)理”專欄所有文章標(biāo)題制成的詞云

怎么樣,想學(xué)了吧,?

不急,,這個其實很簡單,下面我將以實例詳細(xì)的講解制作這張圖的步驟,,即使是小白的你,,也能做出這樣精美的個性化詞云。

4.1 個性化詞云制作

我把個性化詞云的制作分為3個步驟,,即抓取數(shù)據(jù),、文本處理和詞云制作,詳見下圖:

個性化詞云制作的步驟

4.1.1 數(shù)據(jù)獲取

從本質(zhì)上講,,詞云是反映某一特定主題的文本數(shù)據(jù)的可視化展示,。比如,上面的喬幫主詞云反映的就是“產(chǎn)品經(jīng)理”專欄中較為熱門的關(guān)鍵詞/話題,。所以,,要制作一個“出彩”且有內(nèi)涵的自定義詞云,文本不能無規(guī)律,,需要定向的獲取特定的文本數(shù)據(jù),。

筆者對前不久上映且廣受好評的電影《你的名字》頗感興趣,想分析一下這部電影的市場反響如何,,先聊聊這部分?jǐn)?shù)據(jù)的獲取,。

對于影片的分析,首選當(dāng)然是豆瓣電影,,因為它是國內(nèi)最具有參考價值的影評網(wǎng)站,,從文本中能得到很有價值和有意思的信息,。但考慮到文本數(shù)據(jù)獲取的難易程度,我先介紹如下3個數(shù)據(jù)獲取的方法:

(1)自己編寫爬蟲,,想要什么數(shù)據(jù)就去抓取什么數(shù)據(jù),,既經(jīng)濟(jì)(用爬蟲工具會花錢),又會增加“自己動手,,豐衣足食”的成就感,,最重要的是,略施小計就可以躲避豆瓣的封IP機(jī)制,。

用python編寫爬蟲抓取豆瓣影評數(shù)據(jù)

(2)利用集搜客這樣的爬蟲軟件去抓取數(shù)據(jù),,不需要編程技術(shù),,且簡單易上手,,但是可能會被封IP。

(3)采用新浪微輿情這個大數(shù)據(jù)工具,,因而不用豆瓣的評論數(shù)據(jù),,在互聯(lián)網(wǎng)上進(jìn)行全網(wǎng)信息搜集,獲取有關(guān)該影片的熱門文章標(biāo)題作為分析的文本數(shù)據(jù),,這種方法是三種中最為輕松簡單的,,而且獲取的是全網(wǎng)的數(shù)據(jù),大家可以有選擇性的選取自己需要的數(shù)據(jù),,操作步驟如下圖所示:

用新浪微輿情獲取文本數(shù)據(jù)

因為最近學(xué)了點(diǎn)Python,,故筆者選擇了用Python編寫爬蟲來獲取了豆瓣這部分的影評數(shù)據(jù)。

獲取《你的名字》豆瓣電影的影評數(shù)據(jù)

抓取后的數(shù)據(jù)整理成如下表格:

保存到本地的《你的名字》豆瓣影評數(shù)據(jù)

接下來,,就是把文本數(shù)據(jù)單獨(dú)取下來咯,,全選“評論內(nèi)容”這一列,把這些影評數(shù)據(jù)占到記事本上,,作為接下來分析的“原材料”,。

4.1.2 文本處理

一般情況下,文本數(shù)據(jù)的處理包含很多方面,,如分詞,、詞性標(biāo)注、詞頻統(tǒng)計,、文本分類,、情感分析、關(guān)鍵詞提取,、文本摘要提取等,。

在這里,制作詞云只需要考慮關(guān)鍵詞提取和詞頻統(tǒng)計這兩個板塊,。

這里使用到的工具是前面提及的熱詞分析工具---圖悅,。將《你的名字》豆瓣評論的文本部分粘貼到上圖中左邊的文本框中,,再點(diǎn)擊右上方的“分析出圖”,系統(tǒng)顯示完成后,,右邊的預(yù)設(shè)詞云會發(fā)生變化,,此時點(diǎn)擊“導(dǎo)出”,即可得到詞頻的csv文件,。

經(jīng)圖悅處理得到的詞頻csv文件

這里去除詞語和詞頻兩列,,用來進(jìn)行接下來的詞云制作。

4.1.3 詞云制作

處理詞云,,筆者用到的工具是Tagul,。下面是它的的主頁展示:

Tagul主頁

(1)詞頻載入格式

在頁面左上方的“Words”處,就是加載詞語及詞頻的地方,,這里需要注意一下它的載入格式,。,如下表所示:

Tagul的詞頻載入格式

上表中,,前兩列的“Word”和“Weight”就是剛才經(jīng)處理過的詞語和詞頻,,Color一欄則是設(shè)置該詞語的顏色,這是個性化詞云中很關(guān)鍵的一個要素,,會直接影響到最終的詞云呈現(xiàn)效果,。這里可以不填寫,那么在形成詞云時默認(rèn)隨機(jī)生成顏色,。如果要形成定制化的顏色,,則需要設(shè)置采用16進(jìn)制的色值,以下是常用的顏色代碼表,,即色值表,。

常用的16進(jìn)制色值表

與此類似,字體也可選可不選,,需要定制的話,,則可進(jìn)行相應(yīng)的設(shè)置。

“Repeat”這項則表示該詞語是否會重復(fù)出現(xiàn),,填寫“0”,,則表示不重復(fù),填寫“1”,,則表示重復(fù),。為了保持信息的精準(zhǔn)度,減少噪聲,,一般選擇填寫“0”,。

后面的URL鏈接就忽略了,因為有前面的設(shè)置,就不需要進(jìn)行網(wǎng)頁鏈接,。

按照上述操作,,出詞語和詞頻兩例外,筆者還定制了“Color”和“Repeat”這兩項,,結(jié)果顯示如下,。

最終的詞語載入表

全選該表格的文字部分,將其粘貼到“Import Words”的文本框里,,進(jìn)行保存,。

(2)載入中文字體

因為Tagul是老外做的一個在線詞云制作網(wǎng)站,所以Tagul不支持中文,,這需要我們載入能支持中文顯示的字體,,如下圖所示,筆者載入的是“You Yuan(幼圓)”字體,。

載入中文字體

(3)處理背景圖片

加載了字體,,可以說這是個性化詞云制作的核心部分,詞云最終效果的美與不美就在此一舉,。

值得注意的是,,在載入圖片之前的圖片選取步驟時,,需要選擇背景和主題對比比較明顯的圖片,。從接下來的圖片預(yù)處理過程中,你會發(fā)現(xiàn)這一點(diǎn)的重要性,。

詞云自定義圖片的初始狀態(tài)

筆者選取的是《你的名字》最為標(biāo)志性的一張海報,,看起來很有感覺:既有男女主角的形象,也交代了他們所處的生活環(huán)境,,中間則是影片中重要的提條線索---彗星,。這張圖初始狀態(tài)看似雜亂,不好處理,,但仔細(xì)觀察,,可以發(fā)現(xiàn)主體(男女主角)和背景(天空、城市和彗星)之間的對比度和色相差異還是很明顯的,。在Tagul的“Custom Shape”的設(shè)置中可以進(jìn)一步處理背景和主體之間的對比度問題,。

在“Shapes”處載入圖片后,點(diǎn)擊上載成功后圖片的右下角“齒輪”,,打開圖片預(yù)處理,。其中,“Threshold”處理景深,,可以拉開/縮小背景和主體之間的差異,;“Edges”則是處理主體輪廓的銳度,可以調(diào)節(jié)圖片的清晰程度模糊程度。這里的要點(diǎn)是---淡化背景,,清晰主體輪廓,。

淡化背景,強(qiáng)化主體輪廓

好了,,完成上面繁瑣的步驟之后,,現(xiàn)在是見證奇跡的時刻了,點(diǎn)擊右上方大大的黑體字“Visualize”,,待進(jìn)度條加載完畢后,,即可得到如下的最終效果圖:

最終的詞云效果圖

4.2 網(wǎng)絡(luò)可視化利器--- Gephi

Gephi是一款開源免費(fèi)跨平臺基于JVM的復(fù)雜網(wǎng)絡(luò)分析軟件, 其主要用于各種網(wǎng)絡(luò)和復(fù)雜系統(tǒng),動態(tài)和分層圖的交互可視化與探測開源工具,,下載地址為https:///,。網(wǎng)上目前比較權(quán)威的Gephi教程是在Udemy上的Ooof liu講解的《Gephi中文教程》,地址為https://www./gephi/,,看完這個部分仍有饒有興趣的小伙伴可以去學(xué)習(xí)下,。

下面是由Gephi制作的各種網(wǎng)絡(luò)圖,這些圖不僅包含了豐富的信息量,,而且極富美感,,在吸引眼球的同時還給予我們有意義的信息。

各種由Gephi制成的網(wǎng)絡(luò)圖

Gephi是一款信息數(shù)據(jù)可視化利器,它的一般應(yīng)用場景如下:

  • 探索性數(shù)據(jù)分析
  • 鏈接分析
  • 語義網(wǎng)絡(luò)分析
  • 社交網(wǎng)絡(luò)分析
  • 生物網(wǎng)絡(luò)分析

以下簡單介紹下它的使用方法,。

在操作下面步驟之前,,先去Gephi官網(wǎng)上下載最新版的0.9.1 version,這是免費(fèi)的,,且支持中文,,還有豐富的插件下載,這簡直是數(shù)據(jù)可視化愛好者的福音,!

值得注意的是,,這款軟件是用Java編寫的,所以需要安裝Java環(huán)境,,這個有點(diǎn)磨人,。演與演員的關(guān)系作為分析對象,來詳細(xì)解讀如何制作一個“秀外慧中”的社交網(wǎng)絡(luò)可視化圖譜,。

4.2.1 制作源數(shù)據(jù)

Gephi的源數(shù)據(jù)可以在excel中完成,。在excel中,僅輸入2列即可,,表頭嚴(yán)格按照Gephi的格式來制作,,第一列為“Source”,第二列為”Target”,。下面以豆瓣上評分6以下的國內(nèi)電影的導(dǎo)演(選取的是張藝謀,、陳凱歌,、馮小剛等大家耳熟能詳?shù)膶?dǎo)演,演員隨之確定)和演員關(guān)系表為例,,做成如下格式:

在Excel上編輯Gephi的源數(shù)據(jù)

做好源數(shù)據(jù)之后,,記得保存為CSV格式,Gephi僅能讀取這種格式的數(shù)據(jù),。

4.2.2 導(dǎo)入數(shù)據(jù)

在導(dǎo)入數(shù)據(jù)時,,分別在“分隔符”、“如表格”,、“格式”這三個選項下選擇“逗號”,、“邊表格”、“GBK”,。接下來點(diǎn)擊“下一步”,,完成數(shù)據(jù)的導(dǎo)入。

在Gephi中導(dǎo)入csv數(shù)據(jù)

4.2.3 調(diào)整網(wǎng)絡(luò)布局

剛打開“圖”,,也就是網(wǎng)絡(luò)圖的圖形界面時,,這幾百個節(jié)點(diǎn)“蝸居”成一團(tuán),有點(diǎn)盤古開天辟地前“渾沌如雞子”的感覺,,但這個模樣離我們心中的審美還有很長一段距離呢,。

初始狀態(tài)的網(wǎng)絡(luò)圖

不過,不用著急,,下面幾個簡單的步驟就能讓它“脫胎換骨”,,完成華麗的變身。

在左上方的“布局”欄目中,,選擇其中的任一算法,,并可以在下方的操作界面修改默認(rèn)算法參數(shù),也可使用默認(rèn)的參數(shù),。單擊圖中運(yùn)行按鈕,布局算法生效,。

選擇“布局”中的算法

選擇不同的“布局”算法,,網(wǎng)絡(luò)圖的形態(tài)就會有相應(yīng)的變化,以下是其中最為典型的集中算法及其拓?fù)鋱D,。

各種“布局”算法的網(wǎng)絡(luò)圖拓?fù)湫螒B(tài)

在這里,,筆者選取由“Frunchterman Reingold”算法確定的呈蒲公英花朵狀的結(jié)構(gòu)作為初始形態(tài)。

網(wǎng)絡(luò)布局做好后,,我們完成了這個網(wǎng)絡(luò)圖的“骨架”搭建,,下一步則需要對它的外表進(jìn)行修飾,包括節(jié)點(diǎn),、邊和背景等部分的美化,。

4.2.4 美化

在這里,,我們可以對網(wǎng)絡(luò)圖進(jìn)行“美容”,給它著上靚麗的顏色和合適的背景作為襯托,。

如下圖所示,,我們可以在“外觀”一欄對節(jié)點(diǎn)和邊進(jìn)行著色,然后在下方選擇合適的背景,,要注意節(jié)點(diǎn),、邊和背景之間的色差和對比。

給節(jié)點(diǎn),、邊和背景選擇合適的顏色

還需要注意一點(diǎn),,沿著“外觀”>“節(jié)點(diǎn)”>”數(shù)值設(shè)定”這一路徑,讓節(jié)點(diǎn)根據(jù)連接數(shù)的多少而顯示相應(yīng)的大小,,使該網(wǎng)絡(luò)圖更有層次感,;同理,可以對邊進(jìn)行類似的設(shè)定,,則兩個聯(lián)系緊密的節(jié)點(diǎn)間的邊將變得更寬,。

經(jīng)過調(diào)整后,可以得到如下的網(wǎng)絡(luò)圖,。

顏色調(diào)整后的效果圖

4.2.5 顯示標(biāo)簽

經(jīng)過上述幾個操作步驟之后,,網(wǎng)絡(luò)圖還需要加入最為重要的一項內(nèi)容---標(biāo)簽,也就是前面提及的導(dǎo)演及演員的姓名,,反映在節(jié)點(diǎn)上,,由此完成他們之間的社交網(wǎng)絡(luò)圖的基本繪制。

沿著“窗口”>“預(yù)覽設(shè)置”的路徑,,打開“預(yù)覽設(shè)置”,,界面顯示如下。其中,,需要在“節(jié)點(diǎn)標(biāo)簽”這部分完成字體的選擇,,把默認(rèn)的西文字體變?yōu)橹形淖煮w。除此之外,,此處還可以進(jìn)行邊框,、字體大小、顏色,、透明度等的設(shè)置,。

在“預(yù)覽設(shè)置”中設(shè)置中文字體

完成上述選項后,還需要在軟件界面的下方,,點(diǎn)擊一下左下角那個大大的“T”,,則節(jié)點(diǎn)標(biāo)簽就會顯現(xiàn),旁邊也有些字體調(diào)節(jié)鈕,,大家可以摸索下,。

在“布局”中,,選擇“標(biāo)簽調(diào)整”算法,得到下圖:

最終效果圖

圖中各個節(jié)點(diǎn)的字體隨節(jié)點(diǎn)的重要性(由度,、連入度或連出度確定)而呈現(xiàn)出不同之大小,。所以,大家先看文字,,了解其中最為突出的一些演員和導(dǎo)演,,其次在看他們之間的關(guān)系。

筆者比較懶,,這個網(wǎng)絡(luò)圖其實還可以進(jìn)行更深入的優(yōu)化的,,有興趣的小伙伴可以嘗試著做得更絢麗一些。

4.3 數(shù)據(jù)地圖

數(shù)據(jù)地圖,,在Excel2013版及以上中都有三維地圖,,還有一些BI工具中也集成了這個模塊,當(dāng)然也有專業(yè)的地圖GIS軟件,,如地圖慧,、智圖等。由于筆者之前寫過一篇關(guān)于數(shù)據(jù)地圖如何運(yùn)用的文章,,在此不再贅述,,詳見《運(yùn)營實操|15分鐘學(xué)會數(shù)據(jù)地圖分析》

好了,,上面的工具部分介紹完畢,,該進(jìn)入最終的收尾階段了。在某種意義上講,,上面介紹的若干工具都是為接下來的“數(shù)據(jù)新聞”部分做準(zhǔn)備---它們是數(shù)據(jù)新聞中不可獲取的一部分,,是數(shù)據(jù)新聞內(nèi)容呈現(xiàn)的重要“武器”。

5 數(shù)據(jù)新聞

在正式介紹數(shù)據(jù)新聞之前,,筆者先聊聊,,為什么需要數(shù)據(jù)新聞這種新型的新聞報道方式。

這里,,筆者引用美國Northwestern University人文與社科學(xué)院的Prof BrianKeegan的一段話作為注解:

在當(dāng)代,,對于信息過載,以及恐懼,、不確定性和懷疑等情緒的焦慮氛圍下,數(shù)據(jù)驅(qū)動的新聞可以起到關(guān)鍵性的作用,。它們可以為關(guān)于政策,、經(jīng)濟(jì)趨勢、社會變革的討論提供更為堅實的經(jīng)驗基礎(chǔ),。

由此可見,,信息過載,、信息失真和現(xiàn)實世界廣泛存在的不確定性,導(dǎo)致人們不再相信沒有充分依據(jù)的信息,,因而數(shù)據(jù)新聞這種更有說服力的信息載體呼之欲出,。

5.1 數(shù)據(jù)新聞簡介

數(shù)據(jù)新聞,又叫數(shù)據(jù)驅(qū)動新聞,。是指基于數(shù)據(jù)的抓取,、挖掘、統(tǒng)計,、分析和可視化呈現(xiàn)的新型新聞報道方式,。它致力于從海量數(shù)據(jù)中發(fā)現(xiàn)新聞線索,或是抓取大量數(shù)據(jù)拓展既有新聞主題的廣度與深度,,最后依靠可視化技術(shù)將經(jīng)過過濾后的數(shù)據(jù)進(jìn)行融合,,以形象化、藝術(shù)化的方式加以呈現(xiàn),,致力于為讀者提供客觀,、系統(tǒng)的報道以及良好的閱讀體驗。

目前,,在大數(shù)據(jù)新聞制作上已經(jīng)積累了經(jīng)驗的國際媒體有《衛(wèi)報》《紐約時報》《華盛頓郵報》等,。

以下是常見的數(shù)據(jù)新聞呈現(xiàn)方式:

不同類型的數(shù)據(jù)新聞

需要注意的是,數(shù)據(jù)新聞不一定非得要復(fù)雜的數(shù)據(jù)來呈現(xiàn)事實,,表現(xiàn)出很高的逼格,。在很多時候,簡單的描述性數(shù)據(jù)即可,,就像下面的一個示例一樣,,數(shù)據(jù)圖表的呈現(xiàn)讓讀者更加清晰、直觀的了解到西藏班在“量”和“質(zhì)”上的變遷,,是“綠葉”,,而內(nèi)陸西藏班的整個發(fā)展歷程才是真正的“紅花”,是該報道的主線,。

一張圖讀懂“內(nèi)陸西藏班”

5.2 數(shù)據(jù)新聞的形式

一般情況下,,數(shù)據(jù)新聞有如下3種形式:

5.2.1 新聞敘事

數(shù)據(jù)新聞體系下的新聞敘事講求客觀理性和邏輯性,從數(shù)據(jù)視角來看待事件與社會話題的方方面面,,加之以形象具體的可視化圖表作為最后的呈現(xiàn)方式,,使讀者對內(nèi)容的真實性和價值性產(chǎn)生信任。

以下是標(biāo)題為《23萬投票紀(jì)錄 回顧第五屆香港立法會》的數(shù)據(jù)新聞,,下面選取了該文中一些具有代表性的數(shù)據(jù)圖示,。

《23萬投票紀(jì)錄 回顧第五屆香港立法會》數(shù)據(jù)新聞中的一些圖示

從上圖中,在運(yùn)用數(shù)據(jù)圖示的同時,借助數(shù)據(jù)分析的方法,,從多維度總結(jié)了議員的投票行為。這種基于數(shù)據(jù)的的表達(dá),,比起單純的文字報道來,,表現(xiàn)清晰,,說服力強(qiáng)。

5.2.2 事實判斷

一個孤立的事件當(dāng)中的少量信息往往缺少關(guān)聯(lián)度,,但如果從正確的角度觀察卻能發(fā)現(xiàn)極為重要的價值,。透過數(shù)據(jù),內(nèi)容運(yùn)營者可以發(fā)現(xiàn)僅憑知覺和傳聞難以感知的,、隱藏在事件/新聞背后線索或假設(shè),,抽絲剝繭、言之鑿鑿的把事件的來龍去脈和其中緣由講述透徹,。

2016年7月25號在DT財經(jīng)上有一篇文章,,文章標(biāo)題為《10萬條掛號大數(shù)據(jù)顯示:互聯(lián)網(wǎng)也救不了看病難》,文章中全篇引用了掛號網(wǎng)各個維度的一手10W數(shù)據(jù),。采用循序漸進(jìn)的邏輯描述并分析看病難互聯(lián)網(wǎng)也很難解決這一難題,。重要的是,作者將這些數(shù)據(jù)制作成可視化的數(shù)據(jù)圖表,,從掛號網(wǎng)注冊醫(yī)院分布,、支持網(wǎng)絡(luò)預(yù)約功能的醫(yī)院占比到預(yù)約掛號量超10萬的醫(yī)院和人數(shù)分布情況,最后到患者參與分享的比例及對候診時間的滿意度分析,,將這些數(shù)據(jù)轉(zhuǎn)化為數(shù)據(jù)地圖,、點(diǎn)狀圖、旋風(fēng)圖和趣味條形圖等可視化形式呈現(xiàn)出來,。

《10萬條掛號大數(shù)據(jù)顯示:互聯(lián)網(wǎng)也救不了看病難》中的可視化圖表

從這個例子可以看出,,數(shù)據(jù)新聞的報道方式能夠在宏觀上對某個事件看得更加清楚與全面,事件復(fù)雜的演進(jìn)過程以及這個過程中的各個方面,,都能描述得直觀且有趣,,最重要的是,很能讓異見者服氣,。

5.2.3 預(yù)測走向

通過數(shù)據(jù)的挖掘和分析,,尋找出有價值的相關(guān)性,繼而增加對相關(guān)事件發(fā)展趨勢的預(yù)測性,,新聞和數(shù)據(jù)相結(jié)合創(chuàng)作出精確和深度報道,,成為大數(shù)據(jù)時代的新聞業(yè)務(wù)發(fā)展方向。

下圖是CNN在今年7月份關(guān)于美國總統(tǒng)大選預(yù)測的數(shù)據(jù)新聞,,全篇大篇幅的介紹了當(dāng)下美國社交媒體上各州對候選人的支持情況,、通過復(fù)雜算法得出的候選人各州獲勝的概率以及哪個州對于總統(tǒng)選舉具有決定性意義等。

CNN在2016年7月份關(guān)于美國總統(tǒng)大選的預(yù)測(局部)

5.3 如何成為一個優(yōu)秀的數(shù)據(jù)新聞內(nèi)容運(yùn)營者

數(shù)據(jù)新聞學(xué)是一門交叉的學(xué)科,,數(shù)據(jù)新聞的產(chǎn)生給傳統(tǒng)的新聞工作者提出了挑戰(zhàn),,傳統(tǒng)的新聞創(chuàng)作理念和方式,要求新聞工作者具備采寫編評等基本專業(yè)技能,,但目前已無法滿足大數(shù)據(jù)時代下數(shù)據(jù)新聞的創(chuàng)作,。

要做好數(shù)據(jù)新聞,需要運(yùn)營者著重提升以下4個方面的素養(yǎng)/能力:

5.3.1 敏銳的數(shù)據(jù)洞察力

數(shù)據(jù)新聞需要大量的數(shù)據(jù),、數(shù)據(jù)分析處理,,不僅僅是要有技術(shù)水平,更需要一雙慧眼,,分得清“真數(shù)據(jù)”和“假數(shù)據(jù)”,,而且還要選擇重要的數(shù)據(jù)和信息進(jìn)行內(nèi)容輸出,為受眾提供更細(xì)致,、精確的事件分析,,又快又準(zhǔn)的報道新聞,數(shù)據(jù)新聞的把關(guān)在數(shù)據(jù)時代更為重要,。

媒體工作者需多渠道的收集數(shù)據(jù),。從公開的數(shù)據(jù)庫或者是政府部門、企業(yè),、機(jī)構(gòu)中獲取數(shù)據(jù),,從這些海量信息中判斷和選擇有表現(xiàn)力的數(shù)據(jù)。當(dāng)媒體工作者獲取數(shù)據(jù)之后,,便開始處理和整合數(shù)據(jù),。將與新聞報道無關(guān)的數(shù)據(jù)篩選、過濾后,,剩下有用的數(shù)據(jù)進(jìn)行整合匯編,,形成新的報道內(nèi)容。

新聞工作者通過數(shù)據(jù)的挖掘和分析,,尋找出有價值的相關(guān)性,,繼而增加對相關(guān)事件發(fā)展趨勢的預(yù)測性,新聞和數(shù)據(jù)相結(jié)合創(chuàng)作出精確和深度報道,,成為大數(shù)據(jù)時代的新聞業(yè)務(wù)發(fā)展方向,。

5.3.2 熟練運(yùn)用計算機(jī)能力

在如今信息爆炸的大數(shù)據(jù)時代,特別是社交網(wǎng)絡(luò),、電子商務(wù)與移動通信把人類社會帶入了一個以“PB”(1024TB)為單位的結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù)信息的新時代,。大量的數(shù)據(jù)和信息擺在新聞工作者面前,傳統(tǒng)的計算機(jī)無法處理大量的,、無規(guī)律的數(shù)據(jù),,需要云計算進(jìn)行分析、處理、統(tǒng)計,。

因此,,對于當(dāng)今的新聞工作者提出了更高的要求,必須熟練運(yùn)用計算機(jī),,掌握一門編程語言,。如果之前沒有編程基礎(chǔ),推薦python,,它的設(shè)計哲學(xué)是“優(yōu)雅”,、“明確”、“簡單”,,掌握一些常用的爬蟲包,、數(shù)據(jù)分析及可視化包以及自然語言處理包,就能很好的將大量的數(shù)據(jù)和信息進(jìn)行友好的呈現(xiàn),。

5.3.3 分析處理數(shù)據(jù)能力

數(shù)據(jù)新聞與傳統(tǒng)的文字圖片新聞不一樣,,數(shù)據(jù)新聞需要大量的數(shù)據(jù),新聞工作者可以通過數(shù)據(jù)發(fā)現(xiàn)問題,、提出問題,,也可以先有了問題之后,再去收集相關(guān)的數(shù)據(jù),。而擁有大量數(shù)據(jù)后,,必須對其進(jìn)行分析和處理,將不需要或不相關(guān)的數(shù)據(jù)過濾掉,,剩下有價值的數(shù)據(jù)加以分析整合,,供新聞編輯使用,。德勤在美國華盛頓特區(qū)的研發(fā)創(chuàng)新團(tuán)隊招聘數(shù)據(jù)記者,,其中最重要的要求就是要具備分析數(shù)據(jù)的能力,,由此可見,,數(shù)據(jù)新聞記者必須具備較強(qiáng)的數(shù)據(jù)分析和處理的能力,,才能勝任此工作。

5.3.4 可視化平面設(shè)計能力

數(shù)據(jù)新聞的可視化表達(dá)為新聞行業(yè)注入了一股新鮮的血液,,讓數(shù)據(jù)新聞充滿希望與活力,。數(shù)據(jù)新聞的可視化圖片將不同的時間和空間聯(lián)系在一起,將繁雜的數(shù)據(jù)簡單化,,便于受眾理解,,更有利于受眾參與其中,,滿足不同受眾的各方面需求。數(shù)據(jù)新聞的可視化是其一大特點(diǎn),,因此對于新聞工作者來說,應(yīng)熟練掌握可視化技術(shù),,學(xué)會識圖制圖以及各種表格的制作,。

最后,,筆者介紹一個數(shù)據(jù)新聞的資料庫,,在這里小伙伴們可以看到國內(nèi)外許多優(yōu)秀的數(shù)據(jù)新聞案例,,要做優(yōu)秀的數(shù)據(jù)新聞制作者,,首先從模仿學(xué)習(xí)做起,。

數(shù)據(jù)新聞信息庫鏈接地址:http:///showcase/


好了,,看到這里的小伙伴,,我?guī)缀蹩梢詳喽ㄊ钦鎼哿?,希望你們能掌握好這些“工具”,成為運(yùn)營領(lǐng)域的“增長黑客”,,不必羨慕什么“技術(shù)流”,,因為創(chuàng)造性思維和強(qiáng)烈的好奇心會給你帶來好運(yùn)的,等到工具,、技能和思維三者融會貫通的時候,,就會像獨(dú)孤求敗那樣:

不滯於物,飛花草木皆可傷人,,草木竹石均可為劍”,!

參考資料:

  1. 范冰,《增長黑客》
  2. 新浪微輿情官網(wǎng)官方介紹
  3. NLPIR在線系統(tǒng)官方介紹
  4. IBM Watson Tone Analyzer官方文檔
  5. 百度百科“數(shù)據(jù)新聞”詞條
  6. CNN在2016.07美國總統(tǒng)大選預(yù)測網(wǎng)站
  7. FT數(shù)據(jù)新聞網(wǎng)

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多