發(fā)布時(shí)間:2020-03-25所屬分類(lèi):計(jì)算機(jī)職稱(chēng)論文瀏覽:1次
摘 要: 摘要數(shù)據(jù)確權(quán)一直是大數(shù)據(jù)交易面臨的挑戰(zhàn)性之一.傳統(tǒng)的確權(quán)手段采用提交權(quán)屬證明和專(zhuān)家評(píng)審的模式,但是缺乏技術(shù)可信度,且存在潛在的篡改等不可控因素.為解決這些問(wèn)題,迫切需要操作性強(qiáng)的確權(quán)方案.基于區(qū)塊鏈技術(shù)和數(shù)字水印技術(shù),提出了一種新的大數(shù)據(jù)確權(quán)方案
摘要數(shù)據(jù)確權(quán)一直是大數(shù)據(jù)交易面臨的挑戰(zhàn)性之一.傳統(tǒng)的確權(quán)手段采用提交權(quán)屬證明和專(zhuān)家評(píng)審的模式,但是缺乏技術(shù)可信度,且存在潛在的篡改等不可控因素.為解決這些問(wèn)題,迫切需要操作性強(qiáng)的確權(quán)方案.基于區(qū)塊鏈技術(shù)和數(shù)字水印技術(shù),提出了一種新的大數(shù)據(jù)確權(quán)方案.首先,引入審計(jì)中心和水印中心,以分離大數(shù)據(jù)完整性審計(jì)和水印生成的職責(zé).其次,基于數(shù)據(jù)持有性證明技術(shù)和抽樣技術(shù),實(shí)現(xiàn)對(duì)大數(shù)據(jù)完整性的輕量級(jí)審計(jì).再次,利用數(shù)字水印技術(shù)的特殊安全性質(zhì),實(shí)現(xiàn)對(duì)大數(shù)據(jù)起源的確認(rèn).最后,針對(duì)整個(gè)確權(quán)過(guò)程中涉及到的證據(jù)的完整性和持久性,利用區(qū)塊鏈的原生特點(diǎn)實(shí)現(xiàn)確權(quán)結(jié)果與相關(guān)證據(jù)的強(qiáng)一致性.正確性和安全性分析結(jié)果表明,該方案能夠?yàn)榇髷?shù)據(jù)的所有權(quán)界定提供新的技術(shù)思路和方法.
關(guān)鍵詞數(shù)據(jù)確權(quán),區(qū)塊鏈,數(shù)字水印技術(shù),密碼學(xué)
1引言
數(shù)據(jù)是繼物質(zhì)、能源之后的第三大基礎(chǔ)性戰(zhàn)略資源.2016年12月,國(guó)務(wù)院印發(fā)的«“十三五”國(guó)家信息化規(guī)劃»中明確指出,優(yōu)先開(kāi)展數(shù)據(jù)資源共享開(kāi)放行動(dòng).在推進(jìn)數(shù)據(jù)資源開(kāi)放共享的實(shí)踐中,須解決的首要問(wèn)題是[1]:數(shù)據(jù)作為一種重要資產(chǎn),其流通和應(yīng)用必然涉及數(shù)據(jù)的所有權(quán)問(wèn)題.明晰數(shù)據(jù)的所有權(quán),是大數(shù)據(jù)交易的前提和基礎(chǔ).數(shù)據(jù)的權(quán)屬關(guān)系不清晰,一方面可能造成后續(xù)開(kāi)發(fā)利用中產(chǎn)生權(quán)屬糾紛問(wèn)題;更嚴(yán)重的是,在數(shù)據(jù)歸屬模糊的情況下進(jìn)行大數(shù)據(jù)分析關(guān)聯(lián),也難以界定權(quán)責(zé)歸屬,數(shù)據(jù)安全和個(gè)人隱私難以得到保障.這些問(wèn)題嚴(yán)重制約著大數(shù)據(jù)的共享開(kāi)放實(shí)踐.因此,數(shù)據(jù)確權(quán)在大數(shù)據(jù)時(shí)代尤為關(guān)鍵,關(guān)系到大數(shù)據(jù)產(chǎn)業(yè)的創(chuàng)新活力及大數(shù)據(jù)交易市場(chǎng)的繁榮.
相關(guān)期刊推薦:《計(jì)算機(jī)科學(xué)》主要報(bào)導(dǎo)國(guó)內(nèi)外計(jì)算機(jī)科學(xué)與技術(shù)的發(fā)展動(dòng)態(tài),涉及面廣的方法論與技術(shù),和反映新苗頭、能起承先啟后作用的研究成果。內(nèi)容涉及程序理論、計(jì)算機(jī)軟件、計(jì)算機(jī)網(wǎng)絡(luò)與信息、數(shù)據(jù)庫(kù)、人工智能、人機(jī)界面、國(guó)際會(huì)議、應(yīng)用等。雜志報(bào)導(dǎo)特點(diǎn)是“前沿學(xué)科”與“基礎(chǔ)研究”相結(jié)合;“核心核術(shù)”與“支撐技術(shù)”相結(jié)合;“倡導(dǎo)”與“爭(zhēng)鳴”相結(jié)合。
數(shù)據(jù)確權(quán)[1]一般是確定數(shù)據(jù)的權(quán)利人,即誰(shuí)擁有對(duì)數(shù)據(jù)的所有權(quán)、占有權(quán)、使用權(quán)、受益權(quán),以及對(duì)個(gè)人隱私權(quán)的保護(hù)責(zé)任等.本文研究數(shù)據(jù)確權(quán)時(shí),主要聚焦于數(shù)據(jù)的所有權(quán),即數(shù)據(jù)歸屬問(wèn)題.具體地說(shuō),產(chǎn)生這批數(shù)據(jù)或者第一個(gè)收集這些數(shù)據(jù)的企業(yè)主體就是這批數(shù)據(jù)的所有者.通過(guò)其他任何方式(交易等)獲得這批數(shù)據(jù)的企業(yè)或個(gè)人都只擁有使用權(quán),而無(wú)所有權(quán).目前,學(xué)術(shù)界對(duì)數(shù)據(jù)確權(quán)的研究成果相對(duì)較少.彭云[2]于2016年在大數(shù)據(jù)環(huán)境下研究了數(shù)據(jù)確權(quán)的核心問(wèn)題.同年,涂燕輝[3]從法律的角度論述了數(shù)據(jù)確權(quán)的緊迫性和必要性.郭兵等人[4]于2017年以保護(hù)個(gè)人數(shù)據(jù)產(chǎn)權(quán)、知情權(quán)、隱私權(quán)和收益權(quán)為核心,提出了一種個(gè)人大數(shù)據(jù)資產(chǎn)管理與增值服務(wù)系統(tǒng).王帥宇等人[5]于2017年公開(kāi)了一種基于區(qū)塊鏈技術(shù)的大數(shù)據(jù)確權(quán)方法及系統(tǒng),但該方法未涉及對(duì)大數(shù)據(jù)源頭的確認(rèn).因此,亟須從技術(shù)角度給出一種可靠且可操作性強(qiáng)的大數(shù)據(jù)確權(quán)方法.
目前,比較有代表性的確權(quán)方法是貴陽(yáng)大數(shù)據(jù)交易所從管理角度提出的“提交權(quán)屬證明+專(zhuān)家評(píng)審”模式.在此確權(quán)模式下,首先,大數(shù)據(jù)的擁有者提交權(quán)屬證明;其次,大數(shù)據(jù)交易所組織專(zhuān)家進(jìn)行評(píng)審;最后,大數(shù)據(jù)交易所公布結(jié)果.專(zhuān)家在評(píng)審過(guò)程中有可能摻雜主觀情感甚至偏見(jiàn),破壞數(shù)據(jù)確權(quán)的公平性;且大數(shù)據(jù)交易所的內(nèi)部人員出于利益關(guān)系可能存在惡意修改等行為.大數(shù)據(jù)交易所缺乏一種機(jī)制來(lái)永久保存評(píng)審材料和評(píng)審結(jié)果以備審計(jì),當(dāng)前交易所一般采用紙質(zhì)文檔和電子文檔保存的方式,存在易丟失和易被篡改等問(wèn)題.此外,鑒于大數(shù)據(jù)數(shù)據(jù)量大的特性,如何實(shí)現(xiàn)在不發(fā)送整批大數(shù)據(jù)的前提下高效、輕量地完成數(shù)據(jù)確權(quán)也是一大挑戰(zhàn).這些不可控因素表明,在技術(shù)上尋找一種解決方案迫在眉睫.
針對(duì)這些挑戰(zhàn),本文基于數(shù)字水印技術(shù)[6]和區(qū)塊鏈技術(shù)[7],提出了一種新的大數(shù)據(jù)確權(quán)方案,該方案具有確權(quán)的公平性、完整性和不可欺騙性.在初始化階段,數(shù)據(jù)源供應(yīng)商首先將大數(shù)據(jù)分塊,并采用BLS短簽名方案[8]對(duì)數(shù)據(jù)塊取認(rèn)證器,利用認(rèn)證器的同態(tài)特性使數(shù)據(jù)源供應(yīng)商不必發(fā)送原始數(shù)據(jù);在確權(quán)請(qǐng)求、證據(jù)挑戰(zhàn)和驗(yàn)證階段,引入審計(jì)中心,數(shù)據(jù)源供應(yīng)商和審計(jì)中心基于隱私保護(hù)數(shù)據(jù)持有性證明[9]和抽樣技術(shù)[10]交互完成大數(shù)據(jù)的完整性審計(jì),其中抽樣技術(shù)確保了審計(jì)中心在挑戰(zhàn)時(shí)抽取數(shù)據(jù)塊的隨機(jī)性;在水印生成和嵌入階段,引入水印中心,由數(shù)據(jù)源供應(yīng)商將能唯一標(biāo)識(shí)自己身份信息的數(shù)據(jù)發(fā)送給水印中心,請(qǐng)求水印生成.水印中心將生成的水印發(fā)送給數(shù)據(jù)源供應(yīng)商,由數(shù)據(jù)源供應(yīng)商完成水印嵌入數(shù)據(jù)塊的工作.在登記上鏈和查詢階段,基于區(qū)塊鏈的內(nèi)生優(yōu)勢(shì)(分布式、不可篡改、共享賬本)實(shí)現(xiàn)確權(quán)結(jié)果和相關(guān)證據(jù)的鏈上高冗余保存,確保確權(quán)結(jié)果的完整性及不可篡改性.本文力圖在技術(shù)上杜絕傳統(tǒng)確權(quán)模式下大數(shù)據(jù)交易所篡改確權(quán)結(jié)果的完整性以及破壞確權(quán)的公平性,確保數(shù)據(jù)源供應(yīng)商的利益,進(jìn)一步為大數(shù)據(jù)交易市場(chǎng)的健康有序運(yùn)作提供技術(shù)支撐.
本文第2節(jié)簡(jiǎn)要介紹雙線性映射、BLS短簽名方案、同態(tài)認(rèn)證器、區(qū)塊鏈和數(shù)字水印技術(shù);第3節(jié)提出一種大數(shù)據(jù)確權(quán)方案;第4節(jié)對(duì)大數(shù)據(jù)確權(quán)方案進(jìn)行正確性分析、安全性分析和復(fù)雜度分析;最后總結(jié)全文.
2.5數(shù)字水印技術(shù)
數(shù)字水印是指將標(biāo)識(shí)信息嵌入到數(shù)據(jù)載體內(nèi)部,以達(dá)到版本保護(hù)、保密通信、文件真?zhèn)舞b別和產(chǎn)品標(biāo)識(shí)等目的.嵌入的信息不影響數(shù)據(jù)載體的使用,并且不易被提取或修改.一旦發(fā)生所有權(quán)糾紛,可以將水印提取出來(lái)進(jìn)行檢測(cè),從而證明版權(quán)的歸屬.一個(gè)完整的水印系統(tǒng)包括水印的生成、嵌入、檢測(cè)和提取.
3大數(shù)據(jù)確權(quán)方案
3.1系統(tǒng)模型
本方案包括4個(gè)主體單元:數(shù)據(jù)源供應(yīng)商P,審計(jì)中心T,水印中心C,Fabric區(qū)塊鏈權(quán)屬登記商業(yè)網(wǎng)絡(luò)B.圖1是本方案中使用的模型.
本方案中各主體單元首先向證書(shū)機(jī)構(gòu)CA申請(qǐng)公鑰數(shù)字證書(shū)(同時(shí)完成認(rèn)證接入);其次,數(shù)據(jù)源供應(yīng)商P對(duì)大數(shù)據(jù)進(jìn)行分塊,運(yùn)用BLS短簽名方案對(duì)數(shù)據(jù)塊分別取認(rèn)證器,并把數(shù)據(jù)塊數(shù)、數(shù)據(jù)塊認(rèn)證器、大數(shù)據(jù)標(biāo)識(shí)符ID的簽名等與大數(shù)據(jù)確權(quán)相關(guān)的確權(quán)請(qǐng)求信息發(fā)送給審計(jì)中心T;再次,審計(jì)中心T利用數(shù)據(jù)源供應(yīng)商P的公鑰驗(yàn)證簽名的正確性,若驗(yàn)證通過(guò),則審計(jì)中心T會(huì)向數(shù)據(jù)源供應(yīng)商P發(fā)送證據(jù)挑戰(zhàn)請(qǐng)求;最后,審計(jì)中心T收到證據(jù)后,利用雙線性對(duì)的雙線性質(zhì)來(lái)驗(yàn)證等式是否成立,若成立,則數(shù)據(jù)源供應(yīng)商P向水印中心C申請(qǐng)生成水印并完成水印嵌入.審計(jì)中心T和水印中心C將挑戰(zhàn)證據(jù)、相關(guān)確權(quán)信息、水印以及相關(guān)元信息以JSON的格式封裝成一筆交易并發(fā)送給數(shù)據(jù)源供應(yīng)商P,待數(shù)據(jù)源供應(yīng)商P簽名以后再將其發(fā)送到Fabric區(qū)塊鏈權(quán)屬登記商業(yè)網(wǎng)絡(luò)B.網(wǎng)絡(luò)中的共識(shí)節(jié)點(diǎn)在鑒定交易中簽名的合法性后,按照共識(shí)算法的要求最終將權(quán)屬信息寫(xiě)入Fabric區(qū)塊鏈.
3.2方案的構(gòu)造
3.2.1參數(shù)
方案中用到的相關(guān)參數(shù)及其意義如下.
1)審計(jì)中心T:負(fù)責(zé)大數(shù)據(jù)完整性審計(jì)事宜實(shí)施的專(zhuān)業(yè)機(jī)構(gòu).
2)數(shù)據(jù)源供應(yīng)商P:發(fā)起大數(shù)據(jù)確權(quán)請(qǐng)求的實(shí)體單元,一般為政府部門(mén)或互聯(lián)網(wǎng)企業(yè).
3)水印中心C:負(fù)責(zé)為數(shù)據(jù)源供應(yīng)商P生成水印,實(shí)現(xiàn)大數(shù)據(jù)起源的確認(rèn).
4)Fabric區(qū)塊鏈權(quán)屬登記商業(yè)網(wǎng)絡(luò)B:負(fù)責(zé)將審計(jì)中心T和水印中心C聯(lián)合構(gòu)造的數(shù)據(jù)(交易)登記上鏈.該網(wǎng)絡(luò)包括注冊(cè)中心CA、數(shù)據(jù)源供應(yīng)商P、節(jié)點(diǎn)X等負(fù)責(zé)共識(shí)的主體單元,其中CA負(fù)責(zé)對(duì)其他主體單元進(jìn)行身份核實(shí)并簽發(fā)公鑰證書(shū)。
4.2安全性分析
本節(jié)將從公平性、完整性、不可欺騙性3方面來(lái)分析大數(shù)據(jù)確權(quán)方案.
定理1該大數(shù)據(jù)確權(quán)方案滿足確權(quán)公平性.
證明:首先,在確權(quán)方案的初始化階段,數(shù)據(jù)源供應(yīng)商P、審計(jì)中心T以及區(qū)塊鏈權(quán)屬登記商業(yè)網(wǎng)絡(luò)B均向CA申請(qǐng)公鑰證書(shū),參與主體的身份得到了確認(rèn),交互行為處在相對(duì)可靠的環(huán)境中,同時(shí)基于CA可以實(shí)現(xiàn)行為不可抵賴性.其次,方案中采用“水印中心C+審計(jì)中心T”替代傳統(tǒng)方法中大數(shù)據(jù)交易所負(fù)責(zé)確權(quán)實(shí)施的模式,消除了大數(shù)據(jù)交易所內(nèi)部人員和專(zhuān)家評(píng)審過(guò)程中帶來(lái)的篡改和主觀威脅等,同時(shí)在證據(jù)挑戰(zhàn)階段,式(3)的可公開(kāi)驗(yàn)證性可以進(jìn)一步增強(qiáng)審計(jì)中心T在確權(quán)過(guò)程中的公平性.本方案將確權(quán)中的完整性審計(jì)和水印分發(fā)進(jìn)行分離,審計(jì)中心T負(fù)責(zé)大數(shù)據(jù)完整性的審計(jì)工作,水印中心C負(fù)責(zé)大數(shù)據(jù)水印的生成,數(shù)據(jù)源供應(yīng)商P負(fù)責(zé)將水印嵌入到數(shù)據(jù)塊中.數(shù)據(jù)上鏈也需要水印中心C、審計(jì)中心T和數(shù)據(jù)源供應(yīng)商P三方簽名后才能有效,缺少任何一方,均完成不了該過(guò)程.
定理2該大數(shù)據(jù)確權(quán)方案滿足確權(quán)數(shù)據(jù)的完整性.
證明:確權(quán)數(shù)據(jù)的完整性一方面是指已經(jīng)完成確權(quán)之后的大數(shù)據(jù)的完整性.在確權(quán)方案的初始化階段,數(shù)據(jù)源供應(yīng)商P首先對(duì)D進(jìn)行分塊,將分塊數(shù)據(jù)記為di,其中1≤i≤n,并且采用BLS短簽名方案對(duì)每個(gè)數(shù)據(jù)塊di取認(rèn)證器σi.然后,供應(yīng)商P將認(rèn)證器集合和大數(shù)據(jù)ID的標(biāo)簽{ψ={σi}1≤i≤n,tag}一起發(fā)送給審計(jì)中心T,審計(jì)中心T收到后,若供應(yīng)商P試圖對(duì)大數(shù)據(jù)D本身進(jìn)行修改或者對(duì)分塊數(shù)據(jù)di進(jìn)行修改,則只有供應(yīng)商P能夠重新找到一個(gè)di′≠di使得(H(Wi)
定理3該大數(shù)據(jù)確權(quán)方案具有不可欺騙性.
證明:初始化階段,數(shù)據(jù)源供應(yīng)商P首先對(duì)D進(jìn)行分塊,將分塊數(shù)據(jù)記為di,其中1≤i≤n,并且采用BLS短簽名方案對(duì)每個(gè)數(shù)據(jù)塊di取認(rèn)證器σi.在確權(quán)請(qǐng)求、證據(jù)挑戰(zhàn)和驗(yàn)證階段,數(shù)據(jù)源供應(yīng)商P將認(rèn)證器集合ψ發(fā)給審計(jì)中心T.數(shù)據(jù)源供應(yīng)商P用自己的私鑰x對(duì)數(shù)據(jù)塊di簽名,具有不可欺騙性.在證據(jù)挑戰(zhàn)時(shí),利用BLS簽名機(jī)制的聚合性,P將挑戰(zhàn)請(qǐng)求chal={(i,vi)}s1≤i≤sc聚合成σ發(fā)送給審計(jì)中心T.審計(jì)中心T會(huì)驗(yàn)證數(shù)據(jù)源供應(yīng)商P的簽名,只有驗(yàn)證成功,數(shù)據(jù)源供應(yīng)商P才會(huì)向水印中心C請(qǐng)求水印生成且在后續(xù)參與交易上鏈.水印是由水印中心C生成的,水印中心C會(huì)將水印記錄在鏈上.后期的數(shù)據(jù)使用者在交易這批數(shù)據(jù)時(shí)可以從大數(shù)據(jù)中提取出水印,進(jìn)而與鏈上的水印進(jìn)行比對(duì),水印一致時(shí)提取的水印才是合法的.在登記上鏈和查詢階段,審計(jì)中心T和水印中心C將確權(quán)結(jié)果和相關(guān)證據(jù)以一筆交易的形式發(fā)給區(qū)塊鏈權(quán)屬登記商業(yè)網(wǎng)絡(luò)B,其中的共識(shí)節(jié)點(diǎn)會(huì)驗(yàn)證審計(jì)中心T和水印中心C發(fā)起的交易的真實(shí)性,只有通過(guò)驗(yàn)證的交易才會(huì)寫(xiě)入鏈上.因此,整個(gè)確權(quán)過(guò)程中的參與確權(quán)請(qǐng)求、證據(jù)挑戰(zhàn)和水印生成的主體行為均具備不可欺騙性.
4.3復(fù)雜度分析
下面給出本方案在大數(shù)據(jù)完整性審計(jì)、水印生成和確權(quán)相關(guān)證據(jù)組成的交易上鏈三階段的復(fù)雜度分析.本方案的通信復(fù)雜度由確權(quán)過(guò)程中(審計(jì)、水印生成和交易上鏈)的通信輪數(shù)表示,如表1所列.
審計(jì)階段的計(jì)算復(fù)雜度由兩部分組成,分別是數(shù)據(jù)源供應(yīng)商的O(n)和審計(jì)中心的O(c),通信復(fù)雜度為O(1),其中n為大數(shù)據(jù)分塊數(shù)目,c為隨機(jī)抽取的數(shù)據(jù)塊數(shù).水印生成階段的計(jì)算復(fù)雜度主要是水印中心產(chǎn)生水印的O(qn),通信復(fù)雜度為O(1),其中q為給數(shù)據(jù)塊嵌入水印的抽取比例.交易上鏈階段的計(jì)算復(fù)雜度主要由審計(jì)中心T、水印中心C和數(shù)據(jù)源供應(yīng)商P計(jì)算簽名組成,共計(jì)O(1),通信復(fù)雜度為O(1).
結(jié)束語(yǔ)本文引入審計(jì)中心和水印中心,以分離大數(shù)據(jù)的完整性審計(jì)和證明數(shù)據(jù)所有權(quán)的水印生成和嵌入,進(jìn)而替代傳統(tǒng)確權(quán)中大數(shù)據(jù)交易所直接實(shí)施確權(quán)的組織和評(píng)審以及由此引發(fā)的確權(quán)不公平和不可信局面;其次,鑒于大數(shù)據(jù)交易所負(fù)責(zé)確權(quán)結(jié)果的保存給確權(quán)結(jié)果的完整性帶來(lái)了篡改威脅和不確定性風(fēng)險(xiǎn),本文引入?yún)^(qū)塊鏈,利用其分布式、高度冗余等特點(diǎn)將確權(quán)結(jié)果的保存從傳統(tǒng)的大數(shù)據(jù)交易所一家轉(zhuǎn)入整個(gè)大數(shù)據(jù)交易生態(tài)圈,實(shí)現(xiàn)了確權(quán)結(jié)果的始終一致性.在本文工作的基礎(chǔ)上,下一步將基于區(qū)塊鏈研究大數(shù)據(jù)交易權(quán)的流轉(zhuǎn),力圖實(shí)現(xiàn)大數(shù)據(jù)交易生命周期中的可追責(zé)性.