觀眾登錄
展商登錄
官方微信
第51屆會(huì)刊
返回頂部
發(fā)布時(shí)間:2014-07-18
“大數(shù)據(jù)”是當(dāng)下一個(gè)如火如荼的話題。大數(shù)據(jù)的確具有其整體性優(yōu)勢——海量信息,全面而系統(tǒng),其價(jià)值和作用有目共睹,不再贅述。
但事物總是“一分為二、對立統(tǒng)一”的,大數(shù)據(jù)因其規(guī)模“龐大”,數(shù)據(jù)散亂,雜波干擾嚴(yán)重,從信度和效度的專業(yè)層面來講,更是良莠不齊。尤其在這 個(gè)霧里看花、真假難辨的年代,對各個(gè)行業(yè)的大數(shù)據(jù)分析我們更應(yīng)該擦亮雙眼,謹(jǐn)慎擇之。而在移動(dòng)醫(yī)療行業(yè),Dr.2認(rèn)為:關(guān)于本行業(yè)的許多大數(shù)據(jù)研究,很大一部分都是偽命題,大批以大數(shù)據(jù)分析結(jié)尾來論證其商業(yè)模式的企業(yè),大部分都在耍流氓,他們不過是在欺騙投資人,欺騙員工,欺騙自己而已,甚至很多從業(yè)者以所謂的大數(shù)據(jù)分析,走上了欺騙客戶,小題大做,危言聳聽,虛言恫嚇的傳銷之路。
這是因?yàn)槟壳?a href="http://bloodbrother.cn/">移動(dòng)醫(yī)療大數(shù)據(jù)分析的規(guī)范性還不夠透明,其雜亂性會(huì)影響所有從業(yè)人員的判斷。面對如此多的數(shù)據(jù),我們不禁要問:數(shù)據(jù)是怎么來的?從哪兒來的?有沒有收集數(shù)據(jù)的統(tǒng)一標(biāo)準(zhǔn)?為什么會(huì)收集這些數(shù)據(jù)?從實(shí)踐的觀點(diǎn)來看,一個(gè)好的移動(dòng)醫(yī)療大數(shù)據(jù)項(xiàng)目應(yīng)該具有實(shí)用性,而實(shí)用性主要體現(xiàn)在大數(shù)據(jù)的經(jīng)濟(jì)性、便利性和可解釋性。
一、經(jīng)濟(jì)性。
此處的經(jīng)濟(jì)性從我們行業(yè)的實(shí)踐性來說,主要指其成本上的可操作性。因?yàn)橐苿?dòng)醫(yī)療大數(shù)據(jù)的獲取成本特別高,如果你不是騙子去造假的話,所以各位同道不要盲目的輕信、宣傳大數(shù)據(jù)的商業(yè)價(jià)值,我絲毫不懷疑其巨大的前景,不過對小企業(yè)來說,沒有緩沖能力,搞好了固然很好,但是十有九不成,一賠就上西天,傷不起啊!
關(guān)于其成本與價(jià)值問題,Dr.2會(huì)在以后的連載中詳述,在此,我們主要關(guān)注移動(dòng)大數(shù)據(jù)的目的性。我認(rèn)為:如果以自己盈利作為唯一目的,那么他的大數(shù)據(jù)分析特別容易耍流氓。也就是說,如果收集數(shù)據(jù)的機(jī)構(gòu)能夠通過修改、扭曲數(shù)據(jù)獲得經(jīng)濟(jì)利益,那么這些數(shù)據(jù)就會(huì)因被扭曲而失真,那么我們要一堆經(jīng)過人為修改、扭曲過的信息干什么呢?
舉個(gè)例子,比如某醫(yī)院委托某第三方公司做一份醫(yī)患關(guān)系滿意度的調(diào)查,此調(diào)查的目的是想要掛在醫(yī)院大廳或者刊登發(fā)表在媒體上給消費(fèi)者看的,也就是為了做宣傳的,那么這份調(diào)查在一開始就具有了功利性。如此,該第三方公司用各種大數(shù)據(jù)研究的手段和方法去網(wǎng)絡(luò)調(diào)查,廣泛回訪,從社交媒體上搜索綜合分析,研究方法確實(shí)是真的,也可以持續(xù)跟蹤非常長的時(shí)間,去盡量搜集完整的數(shù)據(jù)(注意,普及一個(gè)概念,大數(shù)據(jù)不是指大量數(shù)據(jù),而是指對事物研究的整體的,比較全部的數(shù)據(jù)而非抽樣分析調(diào)查來進(jìn)行估算的數(shù)據(jù))。
但是,這樣收集來的所謂的“患者數(shù)據(jù)”,其可信度就真的讓人不敢恭維了。推廣到我們行業(yè)中,多少調(diào)查之前就已經(jīng)定了基調(diào)了?為了某藥,某血糖分析,某血壓監(jiān)測的重大意義的大數(shù)據(jù)分析報(bào)告,諸如此類。
二、便利性。
移動(dòng)醫(yī)療大數(shù)據(jù)給我們的生活、工作帶來便利性了嗎?如果正好相反的話,那么其作用將大打折扣,因?yàn)槲覀儾皇怯盟鼇韯?chuàng)造工作量和麻煩的。比如,谷歌有一個(gè)名為“谷歌流感趨勢”的工具,它通過跟蹤網(wǎng)民的搜索詞等相關(guān)數(shù)據(jù)來判斷全美地區(qū)的流感情況(比如患者會(huì)搜索“流感”兩個(gè)字)。這個(gè)工具工作的原理大致是這樣的:設(shè)計(jì)人員置入了一些關(guān)鍵詞(比如溫度計(jì)、流感癥狀、肌肉疼痛、胸悶等),只要用戶輸入這些關(guān)鍵詞,系統(tǒng)就會(huì)展開跟蹤分析,創(chuàng)建地區(qū)流感圖表和流感地圖。
但是,現(xiàn)實(shí)要遠(yuǎn)比理論復(fù)雜。谷歌搜索的結(jié)果和使用者人群“自我估計(jì)”的流感發(fā)病率相關(guān),而當(dāng)研究結(jié)果公布后,由于谷歌巨大的影響力,這使報(bào)告本身就對人們正常生活和行為有了影響,不但給生活帶來了一些不便,小題大做,而且很多人在搜索的時(shí)候還會(huì)受此影響,習(xí)慣性關(guān)注或者無意性關(guān)注,造成大數(shù)據(jù)“噪聲”影響大數(shù)據(jù)本身,最終導(dǎo)致大數(shù)據(jù)分析的不準(zhǔn)確。
所以移動(dòng)醫(yī)療大數(shù)據(jù),它囊括了太多的偶然事件、小概率事件。比如一位家庭醫(yī)生給他的患者一臺(tái)電子血壓計(jì),并囑咐其要每天測量并將數(shù)據(jù)記錄下來。而我們每一個(gè)人都是處在不同的環(huán)境氛圍中的。血壓肯定也會(huì)因情境而異。比如患者今天開了個(gè)生日party,昨天買彩票中了500萬大獎(jiǎng)——人逢喜事精神爽啊,明天晚上加個(gè)班,后天看了一部悲劇電影,血壓肯定是會(huì)有變化的,因?yàn)檫@是人體自我調(diào)節(jié)機(jī)制在起作用。而這對于醫(yī)學(xué)上的動(dòng)態(tài)監(jiān)測沒有什么參考意義,還因?yàn)獒t(yī)生不可能詳盡的知曉患者日常生活中的各種情況。這里的血壓升高被偷換了概念,而且條件也不成立。
從這個(gè)角度來講,大數(shù)據(jù)非但沒有給我們帶來便利性,還可能會(huì)誤導(dǎo)、干擾我們的判斷,從而影響我們的決策。企業(yè)領(lǐng)導(dǎo)者或者投資人是做什么的?他們做的不僅僅是事,最重要的是做決策。沒什么比一個(gè)半生不熟的大數(shù)據(jù)項(xiàng)目更讓人悲劇了。
三、可解釋性。
其實(shí)在敘述第二條便利性的時(shí)候已經(jīng)涉及到了這一點(diǎn)。可解釋性,這一點(diǎn)很重要。因?yàn)槊鎸Υ髷?shù)據(jù)的使用者,或者面對我們普通大眾,它需要解釋很多問題。
原始數(shù)據(jù)有沒有公布?若否,為什么不公布?
現(xiàn)在大部分人面對的所謂“大數(shù)據(jù)”基本上都是經(jīng)過整合、分析、處理后的信息,而很少有人能接觸到真正的原始數(shù)據(jù)。任何缺少原始數(shù)據(jù)的研究結(jié)果很可能都是問題的。因?yàn)槲覀儾磺宄谶@個(gè)信息整合處理的過程當(dāng)中,信息都被做了哪些加工。這個(gè)過程相當(dāng)不透明。就像水果經(jīng)過加工成了果汁,我們無從知道這個(gè)水果在加工前是爛水果還是新鮮水果。同樣,我們所面對的現(xiàn)成的“大數(shù)據(jù)”的前身——“原始數(shù)據(jù)”,被加工前到底是不相關(guān)的垃圾數(shù)據(jù)還是相關(guān)的目標(biāo)數(shù)據(jù),我們一無所知。如果不公布原始數(shù)據(jù),這就需要一個(gè)合理的解釋。(來源:企業(yè)網(wǎng)D1net )