最近,,區(qū)塊鏈的熱潮引發(fā)了人們對技術革新的渴望?;ヂ?lián)網(wǎng),、大數(shù)據(jù)、人工智能……正以改變一切的力量,,掀起一場影響人類所有層面的深刻變革。 與區(qū)塊鏈技術稅務總局剛開始研究不同,,網(wǎng)絡爬蟲技術已經(jīng)應用于稅收工作,,成為稅務機關治稅的又一把利器。網(wǎng)絡爬蟲到底有多可怕,?稅務稽查網(wǎng)絡爬蟲到底能干什么,?網(wǎng)絡爬蟲到底是怎么抓取納稅人涉稅疑點的?2017年第12期《稅務研究》雜志刊發(fā)的《爬蟲技術在稅務稽查中的應用與思考》一文解析了這些問題,,小編這就帶您去看看,。 爬蟲技術在稅務稽查中的應用與思考 張福偉 一、 稅務稽查面臨的信息困境 (一)信息獲取渠道單一,,內容有限 在傳統(tǒng)的稅務稽查工作中,,檢查人員主要依賴于企業(yè)的報表(會計報表、納稅申報表),、會計憑證,、發(fā)票和第三方的鑒證報告(會計師事務所或稅務師事務所出具的審計報告等)來獲取所需信息,但由于這些資料均是由被檢查的企業(yè)提供,,很難保證其真實性,。為此,稅務部門在納稅申報表上設計了大量的關聯(lián)項目,,在一定程度上規(guī)避了一些常見的涉稅風險,,同時也大大增加了納稅人的負擔。雖然進行了多次的優(yōu)化,,但納稅申報表項目之多還是飽受爭議,。隨著“放管服”工作的推進以及稅務營商環(huán)境的進一步優(yōu)化,納稅申報表也有從繁向簡演變的趨勢,,而這會使稅務稽查人員獲取的信息進一步減少,。 (二)第三方信息的獲取還停留在初級階段 目前,稅務稽查工作采用的第三方信息更多的是來自于銀行交易數(shù)據(jù)的查詢與比對,。而這些信息僅僅是流水賬式的數(shù)據(jù)羅列,,其中個別信息還只是不完整字段的紙質信息,,極不方便分析、統(tǒng)計,。 (三)市場主體資本運作模式,、交易模式不斷創(chuàng)新,對稅務稽查工作提出了挑戰(zhàn) 現(xiàn)如今,,各種商業(yè)模式不斷創(chuàng)新,,從盈利模式、資本運作模式,,到交易的結構,、支付的手段等都在不斷的變化。企業(yè)為了適應這種變化,,便更加依賴信息化,。集團企業(yè)的財務中心模式、人工智能在內外部審計的應用等對稅務稽查工作提出了新課題,、新挑戰(zhàn),。 二、 爬蟲技術在稅務稽查工作中的應用與面臨的問題 爬蟲技術已經(jīng)成為搜索引擎的重要組成部分,。傳統(tǒng)的搜索引擎雖然已成為人們檢索信息的重要工具,,但傳統(tǒng)的搜索引擎也存在著一定的局限性,如:效率低,,搜索引擎所返回的結果包含大量用戶不關心的網(wǎng)頁,;有限的搜索引擎服務器資源與無限的網(wǎng)絡數(shù)據(jù)資源之間的矛盾進一步加深;不能很好地發(fā)現(xiàn)和獲取不同數(shù)據(jù)結構的信息,。而“網(wǎng)絡爬蟲”可以完全不依賴用戶干預實現(xiàn)網(wǎng)絡上的自動“爬行”和搜索,,可以根據(jù)既定的目標更加精準地選擇抓取相關的網(wǎng)頁信息,有助于在互聯(lián)網(wǎng)海量信息中快捷獲取有用的涉稅信息,。 (一)爬蟲技術在稅務稽查工作中的應用 在2010年前后,,各地稅務機關已經(jīng)開始嘗試使用爬蟲技術進行第三方數(shù)據(jù)的采集和分析,并收獲了一定成效,。例如,,青島市國家稅務局利用爬蟲軟件,爬取了某境外上市公司的減持信息,,進而查處了某境外非居民企業(yè)股權轉讓案件,,查補稅款接近2億元;2016年,,福州市國家稅務局爬取了企業(yè)十大股東變化信息,,繼而對涉及企業(yè)開展評估,查補稅款6 399.8萬元,,調減以前年度虧損71.91萬元,。 爬蟲技術在稽查工作中的應用呈現(xiàn)出以下特點:一是從地域上看,,沿海地區(qū)由于經(jīng)濟發(fā)達,涉及股權等資本交易的事項較多,,爬蟲技術應用也較多,;二是從采集的信息內容看,爬蟲技術主要集中在股權等資本交易事項上,,特別是上市公司,、中小板、創(chuàng)業(yè)板的強制披露信息的采集與分析,;三是從合作形式上看,,大部分地區(qū)都依托第三方科技公司進行開發(fā),自行開發(fā)的較少,;四是從實施成效上看,,亮點不少,但占比不大,,尚未形成有品牌效應的核心產(chǎn)品。 (二)爬蟲技術在稅務稽查工作中面臨的問題 1.信息覆蓋面較窄,。例如,,爬蟲技術主要針對的是上市公司的公告和流通股股東變化,對于非上市公司信息的變化和其他股東的變化情況還不能掌握,。另外,,股權異地轉讓和合伙企業(yè)的穿透問題還有待進一步的探索。 2.信息源不穩(wěn)定,。一方面是由于網(wǎng)絡信息變化快,,同時,數(shù)據(jù)的真實性差,,所以常會出現(xiàn)數(shù)據(jù)差錯,。因此需要在多個網(wǎng)站之間進行數(shù)據(jù)比較,在生成數(shù)據(jù)結果后還需要再次通過多方面信息進行核實,。另一方面是由于“網(wǎng)絡爬蟲”的技術特點,,網(wǎng)頁的框架結構的變動會對抓取數(shù)據(jù)產(chǎn)生極大的影響,因此需要時常關注目標網(wǎng)頁是否發(fā)生變動,,并及時對程序進行修改維護,。另外,隨著涉稅信息采集面的增加,,上述問題發(fā)生的概率也成倍增加,,維護成本也會增加。 3.信息安全成本較高,。為了保證數(shù)據(jù)安全,,爬蟲軟件幾乎都要實施嚴格的內外網(wǎng)物理隔離,。因此,互聯(lián)網(wǎng)采集的數(shù)據(jù)通常是通過人工拷貝的方式復制進內網(wǎng)再進行加工,。這種方式打斷了數(shù)據(jù)從采集到加工的過程,,阻斷了全自動化的進程,無形中增加了運行成本,、降低了效率,。 4.人才十分匱乏。運用爬蟲技術采集信息,,需要既精于稅收業(yè)務又懂計算機技術的人員,,但工作中,這種人才非常少,。 5.缺少統(tǒng)籌規(guī)劃,。無論是內部的人力資源、財力資源的配置,,還是外部環(huán)境的溝通與構建都沒有一個明確的實施目標與路徑規(guī)劃,,亦或是有規(guī)劃但可行性不強。 三,、 加強爬蟲技術在稅務稽查工作中應用的建議 (一)從零散,、不成體系的應用向系統(tǒng)集成轉變 集成的主要內容包括數(shù)據(jù)源和分析模型。其中,,數(shù)據(jù)源不應該僅僅是上市公司的信息,,也不僅僅是區(qū)域的信息,而應是全國交易市場的信息及海外交易市場的信息,,這些可以參照反避稅工作所進行的數(shù)據(jù)采集和對比工作,。關于異質的數(shù)據(jù)結構的問題,國家稅務總局進行標準化并定義好稅務端的接口即可,,數(shù)據(jù)清洗和加工工作則可以交由專門的機構進行,。此外,為了保證爬蟲軟件的效率,,同時減少后期數(shù)據(jù)的清洗和校驗工作,,可以采取“買數(shù)據(jù)”的方式,從目前基于網(wǎng)頁的海淘式采集向從專業(yè)的數(shù)據(jù)公司購買清洗后的數(shù)據(jù)源轉換,,以大大提高“網(wǎng)絡爬蟲”的效率,。 (二)從關注交易向關注資本轉變 稅務稽查的核心是對交易的判定,從而了解交易各方的情況,。但交易是隱形的,、復雜的,交易實質不容易把握與甄別。因此,,稅務稽查工作應運用爬蟲技術,,抓住資本這個關鍵,用資本的軌跡來重構企業(yè)交易行為的軌跡,,通過兩者相互印證,,從而還原商業(yè)實質,強化征管,。另外,,通過資本還可以定位稅收的風險點,例如在稅務部門“打虛打騙”過程中,,利用爬蟲技術勾勒出涵蓋自然人的資金流圖譜,,用金稅工程三期系統(tǒng)的數(shù)據(jù)勾勒出涵蓋全國的發(fā)票流圖譜,并將兩者進行對比,,從而發(fā)現(xiàn)交易實質,。 (三)從精準發(fā)現(xiàn)問題向大概率預測轉變 現(xiàn)在的爬蟲技術還停留在發(fā)現(xiàn)問題(如在股東處置資產(chǎn)后是否進行了申報等問題)的階段。未來,,應從發(fā)現(xiàn)問題向大概率預測問題轉變,。例如某公司發(fā)公告進行股權激勵,那么在數(shù)年后可以等待該股權激勵的兌現(xiàn)和轉讓,;某公司計劃重組,,引入其他非關聯(lián)的投資者,那么可以預測該公司的留存收益很有可能發(fā)生減少,,等等。 (四)完善人才隊伍 人們通常談的是人員的素質無法適應現(xiàn)在新形勢下的稅務稽查工作,,而筆者想強調的并不是當前人員素質不高的問題,,而是人才錯配的問題。在實踐中,,精通所有工作的人才幾乎是不存在的,。筆者認為,要想加強爬蟲技術在稅務稽查工作中的應用,,首先要進行的是把稅務部門現(xiàn)有的人力資源按照技術人員與業(yè)務人員進行分類,,在分類的基礎上實現(xiàn)對接和融合;其次才是考慮構建全方位人才隊伍,,實現(xiàn)技術人員與業(yè)務人員的統(tǒng)一,。 (本文作者系北京市燕山地區(qū)國家稅務局局長) |
|