大數(shù)據(jù)報(bào)告滲透于律師工作的很多方面,尤其是在辦理訴訟案件時(shí),,一份數(shù)據(jù)全面,、精準(zhǔn)的大數(shù)據(jù)報(bào)告,不僅能為疑難,、復(fù)雜案件快速提供突破口,,還能進(jìn)一步為制作嚴(yán)密的訴訟策略提供判例數(shù)據(jù)支撐。 在本團(tuán)隊(duì)代理重大訴訟案件之前,,作為案件工作流程的一個(gè)步驟,,我們會(huì)全面梳理案件事實(shí)、法律關(guān)系,、爭(zhēng)議焦點(diǎn),、法條依據(jù)、涉案地塊,、經(jīng)辦法官及代理律師等信息,,形成報(bào)告,以盡可能多的信息輔助主辦律師制定精準(zhǔn)的訴訟策略,。 2018年到2019年,,我們團(tuán)隊(duì)在 Alpha 數(shù)據(jù)庫(kù)的支撐下已制作17篇類案大數(shù)據(jù)報(bào)告,本篇文章總結(jié)了我們團(tuán)隊(duì)的大數(shù)據(jù)報(bào)告制作經(jīng)驗(yàn),,希望與讀者交流分享,。 本文會(huì)詳解類案大數(shù)據(jù)報(bào)告的制作流程,共分為四大板塊,、八個(gè)步驟,。 大數(shù)據(jù)報(bào)告制作流程 確定適當(dāng)?shù)倪x題 我們的大數(shù)據(jù)報(bào)告選題一般會(huì)分為被動(dòng)選題與主動(dòng)選題兩種情形,前者是基于解決客戶問(wèn)題所選,,后者則是為滿足自身系統(tǒng)研究某一問(wèn)題所選,。 大數(shù)據(jù)報(bào)告選題 一,、被動(dòng)選題 以客戶的迫切需求為契機(jī),,根據(jù)客戶的痛點(diǎn)確認(rèn)選題。 以“違法建設(shè)”的行政篇與民事篇這兩篇大數(shù)據(jù)報(bào)告為例,。 在某個(gè)時(shí)間段,,短短5天之內(nèi)就有3單關(guān)于商務(wù)樓、居民樓被認(rèn)定為違建,,被拆除案件的客戶通過(guò)各種途徑找到我們,。而找到我們的客戶多半都已經(jīng)是比較了多家律所,并且通過(guò)層層轉(zhuǎn)介找到我們的,,對(duì)于我們能解決他們痛點(diǎn)往往抱以厚望,。 正是基于客戶的這種需求以及客戶已經(jīng)對(duì)案件情況非常熟悉的情況下,為了不負(fù)客戶的厚望并且解決客戶的痛點(diǎn),我們就對(duì)“違法建設(shè)”如何認(rèn)定,、涉民事合同效力如何確定,、是否屬于歷史遺留、拆除程序如何確定,、被強(qiáng)拆后如何進(jìn)行賠償及法院關(guān)于違建建設(shè)裁判傾向如何等問(wèn)題進(jìn)行全網(wǎng)檢索,,并進(jìn)行全面深入的研究。 制作的違法建設(shè)民事篇和行政篇兩篇大數(shù)據(jù)報(bào)告,,對(duì)于解決客戶痛點(diǎn),、樹(shù)立我們團(tuán)隊(duì)的專業(yè)形象起到了關(guān)鍵作用。 二,、主動(dòng)選題 我們?cè)谶x取類案大數(shù)據(jù)報(bào)告的選題時(shí)一般會(huì)結(jié)合我們團(tuán)隊(duì)的主要研究方向,、案件需求以及團(tuán)隊(duì)開(kāi)設(shè)的土地訴訟系列課程進(jìn)行確定。 如我們開(kāi)設(shè)的《違法建設(shè)治理中的訴訟實(shí)務(wù)》課程,,為了讓整個(gè)課程內(nèi)容更加全面與詳細(xì),,同時(shí)讓課程內(nèi)容可視化、數(shù)據(jù)化,,能給來(lái)聽(tīng)課的客戶及律師同仁答疑解惑,,我們以“違法建設(shè)”為選題,精心制作了5篇大數(shù)據(jù)報(bào)告,;為使下一期的《征收》課程圓滿完成,,我們以“征收”為選題,制作了7篇大數(shù)據(jù)報(bào)告,。 篩選數(shù)據(jù)樣本 類案大數(shù)據(jù)報(bào)告的制作是以案例樣本為核心,,通過(guò)案例樣本研究,不僅可以對(duì)數(shù)據(jù)進(jìn)行分析,,發(fā)現(xiàn)案件突破口,,而且可以從典型案例提取裁判要旨進(jìn)而對(duì)案件進(jìn)行精準(zhǔn)把控,甚至還可以提煉法院裁判傾向,,設(shè)計(jì)訴訟策略,,最后綜合上述分析得出律師建議。 故在確定大數(shù)據(jù)報(bào)告的選題后,,還需要篩選數(shù)據(jù)樣本,。 篩選數(shù)據(jù)樣本的完成需要我們完成第一次機(jī)器篩選與第二次人工篩選。 針對(duì)第一次的機(jī)器篩選,,我們需要做的是如何通過(guò)從類案司法實(shí)務(wù)中總結(jié)提取,、確定下載案例樣本的關(guān)鍵詞; 第二次的人工篩選,,需要我們掌握的是如何逐一查看幾百個(gè)數(shù)據(jù)樣本并進(jìn)行人工篩選,。 下文將對(duì)如何確定關(guān)鍵詞及如何篩選案例樣本進(jìn)行逐一講解: 一,、如何確定關(guān)鍵詞,進(jìn)行第一次機(jī)器篩選 提取關(guān)鍵詞(圖片截取自Alpha案例庫(kù)) 根據(jù)選題從類案司法實(shí)務(wù)中提取關(guān)鍵詞,,在 Alpha 數(shù)據(jù)庫(kù)經(jīng)篩選的樣本案例下載成 Excel 版本,。 對(duì)于關(guān)鍵詞的確定還需三步;
如根據(jù)法理發(fā)現(xiàn)關(guān)鍵詞,、從中文文本出發(fā)發(fā)現(xiàn)關(guān)鍵詞,、從相關(guān)法條的表述中發(fā)現(xiàn)關(guān)鍵詞、從判決的行文中發(fā)現(xiàn)關(guān)鍵詞及從司法裁判法官的習(xí)慣用語(yǔ)中發(fā)現(xiàn)關(guān)鍵詞,。
一篇大數(shù)據(jù)報(bào)告的樣本一般200多例是比較合適的范圍,,多的會(huì)達(dá)到300多例,如果根據(jù)關(guān)鍵詞下載案例量過(guò)多,,則需要進(jìn)入關(guān)鍵詞的校對(duì)環(huán)節(jié),。
關(guān)鍵詞的確定直接和案例數(shù)量掛鉤,如果所得結(jié)果過(guò)多,,人工篩選時(shí)工作量會(huì)相應(yīng)加大,,因此需要確定關(guān)鍵詞,縮小檢索口徑,。 需要注意的是:對(duì)于詞語(yǔ)的使用,,不同法官有不同習(xí)慣,因此會(huì)存在與關(guān)鍵詞同義,、近義的詞語(yǔ)出現(xiàn),。 如違法用地大數(shù)據(jù)報(bào)告中的一個(gè)關(guān)鍵詞是“違法用地|非法用地|違法占地|非法占地|違法占用土地|非法占用土地”,為了保證樣本數(shù)量的準(zhǔn)確及全面,,這就需要我們?cè)诖_定關(guān)鍵詞時(shí)注意其相同或相近的詞語(yǔ),。 對(duì)于關(guān)鍵詞在 Alpha 數(shù)據(jù)庫(kù)的輸入問(wèn)題:需要我們?cè)谙螺d案例之前將確定的關(guān)鍵詞輸入到檢索條件中,為提高下載案例與選題的關(guān)聯(lián)度,,應(yīng)在 Alpha 數(shù)據(jù)庫(kù)案例檢索欄目中的高級(jí)檢索條件項(xiàng)下的“法院認(rèn)為”部分輸入關(guān)鍵詞,,而不是在全文中輸入。 一部分是因?yàn)樵谌妮斎腙P(guān)鍵詞,,下載的案例容易存在大量無(wú)關(guān)案例,,另一部分是因?yàn)榭赡軆H僅是當(dāng)事人提及,法院針對(duì)此問(wèn)題并沒(méi)有審理,,或僅僅是一筆帶過(guò),,這些案例樣本并沒(méi)有研究?jī)r(jià)值。 為了防止后期篩選案例工作量的加大(需要花費(fèi)更多的時(shí)間進(jìn)行篩選),,我們建議在“法院認(rèn)為”部分輸入關(guān)鍵詞,進(jìn)行下載案例,,在下載案例導(dǎo)出時(shí),,建議導(dǎo)出 Excel 表格清單,,這樣方便接下來(lái)逐一對(duì)幾百個(gè)案例樣本進(jìn)行精細(xì)分析并及時(shí)有效記錄數(shù)據(jù)以便后期通過(guò) Excel 的“篩選”功能,進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)與分析,,一目了然,。 例如“2018年最高院國(guó)有土地上房屋征收行政篇大數(shù)據(jù)報(bào)告”關(guān)鍵詞的輸入見(jiàn)下圖。 篩選下載案例 二,、如何瀏覽案例樣本進(jìn)行第二次人工篩選 人工篩選案例 此階段的人工篩選案例不需要深入研究案例,,只需3步初步篩選。
曾經(jīng)的一個(gè)失敗案例就是在做“2018年廣東省國(guó)有土地上房屋征收大數(shù)據(jù)報(bào)告”的人工篩選階段時(shí),,由于沒(méi)有準(zhǔn)確根據(jù)選題進(jìn)行篩選,使得原本無(wú)關(guān)的案例如集體土地轉(zhuǎn)國(guó)有土地,、國(guó)有土地收回引發(fā)的補(bǔ)償問(wèn)題等也進(jìn)入到有效案例樣本中進(jìn)行數(shù)據(jù)提取,,導(dǎo)致在后期數(shù)據(jù)整理分析階段才發(fā)現(xiàn)從247篇有效案例中竟然有185個(gè)案例是無(wú)關(guān)案例,有效案例才62篇,,使得一篇大數(shù)據(jù)報(bào)告因有效案例過(guò)少而不得不終止,。 在此之前團(tuán)隊(duì)成員3人耗時(shí)2周根據(jù)9個(gè)維度對(duì)247篇案例提取的數(shù)據(jù)被確認(rèn)為無(wú)效,由于人工篩選出錯(cuò),,也導(dǎo)致在此之前所有的付出功虧一簣,。 三、如何刪除系列案 第一次機(jī)器篩選與第二次人工篩選后,,還需要對(duì)系列案進(jìn)行刪除,。 因?yàn)槊恳蛔谙盗邪笗?huì)有N個(gè)相同案件事實(shí)及法院認(rèn)為部分,,針對(duì)系列案例不能全部作為樣本數(shù)進(jìn)行研究,而是應(yīng)將N歸為1,,作為一個(gè)樣本基數(shù)進(jìn)行研究,,這樣得出的數(shù)據(jù)才會(huì)存在普遍性,更能說(shuō)明選題問(wèn)題,。 如“2018年最高院國(guó)有土地上房屋征收行政篇大數(shù)據(jù)報(bào)告”通過(guò)第二次人工篩選后,,我們已對(duì)所有案例情況有了初步了解,因此對(duì)此系列案的篩選方法是:
如上圖中展示的部分相同顏色區(qū)域就是一宗系列案。 在我們團(tuán)隊(duì)針對(duì)征收做的7篇類案大數(shù)據(jù)報(bào)告中,,系列案現(xiàn)象就非常突出,。因?yàn)檎畬?duì)一個(gè)片區(qū)同一時(shí)間進(jìn)行征收時(shí),往往涉及范圍較大,,被征收主體較多,,對(duì)此征收行為產(chǎn)生異議,發(fā)生糾紛提起訴訟數(shù)量巨大,,法院在審理上述糾紛時(shí)所認(rèn)定的事實(shí)與“法院認(rèn)為”部分一致,,因此會(huì)存在很多系列案。 為保證一篇類案大數(shù)據(jù)報(bào)告數(shù)據(jù)的可用與準(zhǔn)確性,,我們需要將一宗系列案的N個(gè)案例作為一個(gè)案例樣本使用,。 數(shù)據(jù)整理分析 一篇類案大數(shù)據(jù)報(bào)告的骨骼所在是數(shù)據(jù)框架,血肉所在是對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,,靈魂是以數(shù)據(jù)分析為基礎(chǔ),,結(jié)合典型案例的裁判要旨,體現(xiàn)在律師建議中,。 通過(guò)確定類案大數(shù)據(jù)報(bào)告的分析維度,,對(duì)每一篇案例樣本進(jìn)行維度數(shù)據(jù)提取,再到對(duì)幾百篇案件樣本的所有數(shù)據(jù)進(jìn)行統(tǒng)計(jì)整合,,最后繪制數(shù)據(jù)圖表來(lái)完成一篇大數(shù)據(jù)報(bào)告的骨骼(數(shù)據(jù)框架),。 對(duì)于類案大數(shù)據(jù)報(bào)告數(shù)據(jù)框架的數(shù)據(jù)提取與整理分析,我們同時(shí)也可以挑選出典型案例,,總結(jié)提煉出律師建議,。 對(duì)于數(shù)據(jù)的整理分析需要我們做的是:
一,、確定數(shù)據(jù)分析維度,、明確團(tuán)隊(duì)工作人員分工 框架 所謂框架即一篇大數(shù)據(jù)報(bào)告要分析的維度,,如“2018年最高院國(guó)有土地上房屋征收行政篇大數(shù)據(jù)報(bào)告”中分析的維度有地域分布,、訴訟請(qǐng)求、法院審理情況,、賠償情況,、評(píng)估程序爭(zhēng)議點(diǎn)、征收決定爭(zhēng)議點(diǎn),、補(bǔ)償決定爭(zhēng)議點(diǎn),、典型案例及律師建議。 對(duì)于這些分析維度的確定,,需要我們結(jié)合類案司法實(shí)務(wù),、當(dāng)前選題地域司法特色、閱讀受眾需求及起訴主體痛點(diǎn),,還需要團(tuán)隊(duì)人員頭腦風(fēng)暴會(huì)議的多次思想碰撞,,通過(guò)匯集團(tuán)隊(duì)智慧,充分討論并覆蓋最值得關(guān)注的類案大數(shù)據(jù)報(bào)告的分析維度,。 為方便后期數(shù)據(jù)提取與整合,,在確定分析維度后,對(duì)于每一個(gè)維度內(nèi)容的信息提取標(biāo)準(zhǔn)需統(tǒng)一,。 但會(huì)存在對(duì)同一維度的提取內(nèi)容因不同人對(duì)提取內(nèi)容的措辭不統(tǒng)一,,導(dǎo)致多人多標(biāo)準(zhǔn)多表達(dá)的情況出現(xiàn),會(huì)導(dǎo)致后期統(tǒng)計(jì)數(shù)據(jù)的任務(wù)量加重,,反而降低效率,。 二、提取并整合全部案例數(shù)據(jù) 數(shù)據(jù)整合 我們團(tuán)隊(duì)是如何避免上述問(wèn)題呢,? 如能進(jìn)行一鍵生成的數(shù)據(jù),,如地域分布,審判法院及裁判結(jié)果等信息我們可以利用 Alpha 大數(shù)據(jù)【批量下載】功能,、【檢索報(bào)告】功能一鍵生成的 Excel 表格,,進(jìn)一步篩選達(dá)到事半功倍的效果。 對(duì)需人工提取,、再統(tǒng)計(jì)分析的數(shù)據(jù),,雖然不能一鍵生成,但是我們可以對(duì)可統(tǒng)計(jì)的數(shù)據(jù),,利用數(shù)據(jù)透視功能,,結(jié)合篩選的方法進(jìn)行統(tǒng)計(jì)。 但值得注意的是,,在統(tǒng)計(jì)維度即框架確定后,,我們對(duì)信息的提取需要?dú)w納總結(jié)到位,,是“可統(tǒng)計(jì)”的信息,這樣才能方便我們通過(guò) Excel 表格的數(shù)據(jù)透視,,再結(jié)合“篩選”功能,,統(tǒng)計(jì)數(shù)據(jù)。如何總結(jié)出“可統(tǒng)計(jì)”的信息,,具體大家可以讀幾份文書找到規(guī)律,。 例如“2018年最高院國(guó)有土地上房屋征收行政篇大數(shù)據(jù)報(bào)告”中駁回訴訟請(qǐng)求原因問(wèn)題,我們想研究“國(guó)有土地上房屋征收行政案件為什么那么多案件根本沒(méi)有進(jìn)入實(shí)體審理階段就被法院裁定駁回起訴”這一問(wèn)題,,我們讀了40份樣本后,,總結(jié)出了四類原因:主體資格問(wèn)題、原告的起訴超過(guò)起訴期限,、原告的起訴不屬于行政受案范圍,、其他。 當(dāng)然,,如果在之后的統(tǒng)計(jì)過(guò)程中,,又發(fā)現(xiàn)了新的原因,而且出現(xiàn)頻率較高,,就有必要將這個(gè)新的原因,,從“其他”這個(gè)類別中單獨(dú)列舉出來(lái)。 有了“可統(tǒng)計(jì)”的信息后,, Excel 列表的“篩選”功能讓我們可以非常便捷地統(tǒng)計(jì)出數(shù)據(jù),,比如,我們選擇“主體資格問(wèn)題”,,所有的案例中,,只有“主體資格問(wèn)題”的案例才會(huì)出現(xiàn),統(tǒng)計(jì)出樣本數(shù)據(jù)量,。 同時(shí)在看案例提取數(shù)據(jù)的同時(shí),,對(duì)于案例中值得學(xué)習(xí)的點(diǎn)要進(jìn)行記錄,以便作為后期撰文統(tǒng)稿的素材,;對(duì)比較好的案例要進(jìn)行標(biāo)記單獨(dú)保存,,為后期典型案例的確定進(jìn)行儲(chǔ)備。 大數(shù)據(jù)報(bào)告的制作是一個(gè)長(zhǎng)期而又瑣碎的事情,,所以對(duì)于制作的每一步都要進(jìn)行記錄保存,,以便后期出現(xiàn)錯(cuò)誤時(shí)及時(shí)更正。 三,、運(yùn)用數(shù)據(jù)繪制圖表 繪制圖表 圖表是大數(shù)據(jù)報(bào)告中的重要組成部分,,將海量數(shù)據(jù)以可視化的圖表呈現(xiàn),便于讀者直觀感知數(shù)據(jù),理解數(shù)據(jù)規(guī)律,,這便是數(shù)據(jù)的價(jià)值,。因此在數(shù)據(jù)統(tǒng)計(jì)完成后,我們需要制作圖表,。 圖表的前提是數(shù)據(jù),,所以要確保數(shù)據(jù)的準(zhǔn)確及完整。同時(shí),,不同圖表如餅圖,、條形圖,、柱狀圖所呈現(xiàn)的視覺(jué)效果不一,,要結(jié)合數(shù)據(jù)內(nèi)容進(jìn)行選擇,以期對(duì)閱讀者直接通過(guò)圖表說(shuō)明相關(guān)問(wèn)題,。如上圖“爭(zhēng)議焦點(diǎn)概覽”,,用柱狀圖要比條形圖更加直觀,對(duì)視覺(jué)更加具有沖擊,。 四,、針對(duì)圖表進(jìn)行數(shù)據(jù)分析 數(shù)據(jù)分析 通過(guò)確定恰當(dāng)選題、篩選數(shù)據(jù)樣本,、數(shù)據(jù)整理分析,,終于到了一篇類案大數(shù)據(jù)報(bào)告的血肉所在部分之針對(duì)圖表進(jìn)行數(shù)據(jù)分析環(huán)節(jié),這部分是透過(guò)數(shù)據(jù)表象到本質(zhì)對(duì)數(shù)據(jù)背后的原因進(jìn)行分析,,是總結(jié)幾百篇數(shù)據(jù)樣本裁判傾向?qū)Σ门幸?guī)律的揭示,,是提煉法院觀點(diǎn)對(duì)類案律師建議的分享,也是一篇類案大數(shù)據(jù)報(bào)告最干貨的部分,。 這里,,不僅要統(tǒng)計(jì)爭(zhēng)議焦點(diǎn),歸納法院裁判要旨,,還可以發(fā)現(xiàn)案件突破口及訴訟策略,。 因?yàn)槭亲罡韶洸糠郑砸彩亲晕冶漂偟碾A段,,但除了自我逼瘋之外,,當(dāng)然也有一些技法。 建議在寫作前,,針對(duì)本報(bào)告要寫的每一個(gè)點(diǎn)有針對(duì)性的進(jìn)行知網(wǎng)文章檢索,,每一個(gè)點(diǎn)看幾篇核心期刊等權(quán)威文章,雖然很枯燥,,但有用,。 同時(shí)檢索新聞、微信文章,可以充分了解數(shù)據(jù)背景之后再進(jìn)行寫作,,在寫作過(guò)程中,,對(duì)不確定的點(diǎn)要回歸到案例,翻閱法院認(rèn)為部分,,進(jìn)行法理研究,,這樣才能寫出一篇有理有據(jù)的大數(shù)據(jù)報(bào)告。 定稿 歷經(jīng)寫作后的多次修改,,一篇類案大數(shù)據(jù)報(bào)告的雛形已經(jīng)完成,,但這并不是結(jié)束,因?yàn)橐黄髷?shù)據(jù)報(bào)告并不是僅僅寫完就是完成使命,,它還需要呈現(xiàn)在大眾面前,,在帶給大家知識(shí)盛宴的同時(shí)還要給受眾帶來(lái)視覺(jué)享受。 這就需要我們對(duì)大數(shù)據(jù)報(bào)告進(jìn)行嚴(yán)格的審核和校對(duì),,以確保報(bào)告的數(shù)據(jù),、圖表、行文和排版不出現(xiàn)紕漏,,呈現(xiàn)給受眾精準(zhǔn),、專業(yè)、權(quán)威的報(bào)告內(nèi)容,。 一篇大數(shù)據(jù)報(bào)告的制作完成并非易事,,所以我們會(huì)通過(guò)線下團(tuán)隊(duì)開(kāi)設(shè)的土地訴訟系列課程進(jìn)行推廣,同時(shí)也會(huì)盡可能地在專業(yè)法律平臺(tái)上進(jìn)行投稿,。 大數(shù)據(jù)時(shí)代,,數(shù)據(jù)讓經(jīng)驗(yàn)呈指數(shù)級(jí)增長(zhǎng)。深諳數(shù)據(jù)之威力,,讓數(shù)據(jù)發(fā)聲,。 文 | 宋靜 許瑩 廣東諾臣律師事務(wù)所 文章 文章來(lái)源 | iCourt |
|