掃碼下載APP
及時接收最新考試資訊及
備考信息
隨著社會信息化程度的提高,許多的單位和組織都建立了與之相適應的計算機信息系統(tǒng),并且系統(tǒng)功能不斷完善,存儲了大量電子數據。由于被審計單位軟硬件平臺的異構性以及人為隱瞞信息等原因,造成審計部門與被審計單位之間的信息不對稱,審計人員所獲取的電子數據存在不同程度的質量問題,由于電子審計數據的質量與審計結果的質量密切相關,這就要求審計人員對所獲取的電子數據進行檢查、控制和分析,進行有效的電子數據質量控制,從而降低審計風險。
一、電子數據質量對審計風險的影響
在面向數據的計算機審計中,審計人員了解被審單位的經濟、業(yè)務活動主要是通過其提供的審計數據,如財務報表、交易記錄、原始憑證等,并按照一定的程序進行取證,形成審計意見。由于信息系統(tǒng)的廣泛運用,被審計單位內部積累了大量的電子數據,由于各種原因,被審計單位現有系統(tǒng)數據庫中存在這樣或那樣的“臟”數據,主要表現為重復的數據、錯誤的數據、不完整的數據等,這些都會影響電子數據的質量。
電子數據不但邏輯組織方式多樣,有層次、網狀、關系等,而且物理存儲格式多樣,簡單的可使用文本文件、電子表格文件,復雜的為不同類型的電子數據庫管理系統(tǒng)。審計人員只能評估其風險水平,但卻無法控制和影響電子數據。并且,審計人員實際上缺乏有力的技術手段對數據質量進行檢查評價,只能夠進行簡單的分析判斷。在信息系統(tǒng)環(huán)境下,被審計單位的數據量達到一定的規(guī)模,而且由于介質的變化,使資料修改、刪除更加容易,很少留下審計線索。另外,電子數據的采集、整理和分析過程中,數據的質量問題帶來的審計風險也尤為重要。在實際的工作中,審計人員要根據掌握的技術、實踐經驗、獲得的技術支持等來確定對電子數據的采集、處理方式,這一階段對數據質量的要求比較敏感,可能會給審計帶來風險,例如數據格式存在缺陷,系統(tǒng)格式不兼容,數據分析技術和工具使用不恰當等。
電子數據對于審計工作越來越重要的情況下,帶給審計人員快捷高效的審計技術手段的同時,也對審計人員提出了更艱巨的技術挑戰(zhàn),數據質量的高低將直接對審計結果及其風險產生影響。
二、審計人員對審計電子數據的需求
在“電子數據審計”模式下,審計人員獲得的電子審計數據成為重要的資料來源。雖然審計人員得到電子審計數據的目的可能是多元的,如掌握資金使用情況、進行風險評估等,但整體來看,利用電子審計數據的主要目的是為了取得審計證據,支持其關于審計事項的判斷或結論。盡管現行證據法的滯后性和不確定性使得電子證據在審計工作的實際運用中仍舊面臨問題,但是電子證據,或者通過電子數據獲得的其他證據,及其所帶來的邊際效應,無疑已經成為現代審計人員一個非常重要的證據來源。審計數據的應用目標是取得適當的審計證據,審計數據的質量需求與審計取證需求基本一致。
根據審計取證需求,電子數據應滿足以下兩個方面要求:
一是取證過程的可行性,審計人員能夠比較經濟地利用審計數據進行取證,這就要求審計數據具有可采集、可驗證、可理解、可分析等特點。
二是證據適用性,從電子數據中獲得的審計證據應該滿足審計證據的基本特征、要求。電子數據中獲得的證據是整個證據體系中的一個組成部分,并和其他部分一起,具備充分性、適當性、相關性等一系列特征。
三、常見的電子數據質量問題
隨著數據采集的技術和渠道日益廣泛,審計數據庫中的數據質量主要由進入數據庫中的原始數據源的數據質量決定的。原始數據源中的數據質量問題有許多種,以下主要從電子采集、整理、分析等階段,分析審計人員在實際工作中遇到的問題。
1 數據采集: 數據采集是信息化環(huán)境下對于被審計單位電子數據審計的首要前提和基礎,是在審前調查提出數據需求的基礎上,按照審計目標,采用一定的工具和方法對被審計單位會計信息系統(tǒng)中的數據庫文件進行采集的過程,該階段主要分為以下兩種問題:
?。?)被審計單位的信息系統(tǒng)沒有實現數據接口,或實現了的數據接口不能滿足審計的要求,導致審計人員無法將電子數據遷移至審計軟件系統(tǒng)。
(2)審計軟件環(huán)境無法識別從被審單位的信息化環(huán)境遷移的數據格式,導致使用審計軟件打開電子數據時顯示亂碼或缺少部分數據等情況出現。
2 數據整理:審計人員在獲得電子數據后,首先應處理電子數據本身存在的缺陷,為下一步的數據分析提供保證。該階段常遇到以下三種情況:
?。?)數據缺失:在一些記錄的字段屬性上沒有值,如資金金額、客戶名稱為NULL。這可能是由于采集時值不確定、誤操作或采用缺省值等原因而引起的。
?。?)屬性異常:數據表中某些記錄的屬性值在數據遷移過程中發(fā)生變化,例如數據被采集到審計人員的審計軟件后某數據文件的“日期”字段顯示的屬性為數字類型。
(3)冗余沖突:既有可能是同一數據在不同數據源里的簡單重復,如數據集中有多條記錄表示同一個實體,也有可能重復的數據之間還存在沖突。
3、數據分析:需要審計人員充分理解數據庫中各個數據文件的格式,文件中各字段代表的具體含義,及其各個文件中的相互關聯等情況,運用各種分析方法對電子數據進行深層次的挖掘工作,發(fā)現隱藏其中的問題,分析中遇到的問題主要是:
?。?)數據命名無規(guī)則:底層數據庫中的文件名或文件中的字段名大多使用英文字母或特殊符號,有些被審單位使用某些軟件公司開發(fā)的應用軟件,文件或屬性命名規(guī)則性較差,相關聯的數據文件名稱沒有明顯的區(qū)分,造成審計人員花大量的時間分析文件內容和相互關聯關系,影響審計效率,同時,審計人員也有容易忽略某些具有特殊含義的字段,造成審計風險。
?。?)數據模式沖突:是與數據模式相關的不一致,主要有命名沖突和結構沖突。命名沖突表現為同一名稱表示不同的實體/屬性或不同名稱表示同一實體/屬性。如一個數據源中用“借方”來表示科目表中“借方”屬性名,而在另一個數據源中用“Db”這一英文縮寫來表示。結構沖突通常表現為同一對象在不同的數據源中用不同的表示形式,如對于借貸方余額的存儲,在一個數據源中用“借方余額”和“貸方余額”兩個屬性來表示,而在另一個數據源中用“借貸方余額” 和“借貸方向”來表示。
?。?)數據語義沖突:是與實例相關的不一致,產生的原因主要是不同的設計者在對客觀對象進行闡釋時采用了不同的描述方法。如在一個數據源中用“借”或“貸”來表示“借貸方向”,而在另一個數據源中用“Dr”或“Cr”來表示同一屬性的取值。
?。?)數據值異常:即數據集中存在孤立點,它們不符合數據的一般模型或規(guī)律。造成孤立點的原因很多,可能是數據進行遷移時產生的錯誤,也可能是程序對缺失屬性值自動生成的替代值,同時,孤立點也可能正好反映了數據中蘊含的某種審計線索,審計人員不能簡單將它刪除。
四、處理電子數據質量問題的基本方法
出現電子數據質量問題將直接影響審計結果的準確性,審計人員應予以高度重視。解決這些電子數據質量問題對于提高審計的質量與效率都至關重要,對于不同的問題應該“對癥下藥”,采用不同的解決方法:
1.對于被審計單位的信息系統(tǒng)沒有實現數據接口或實現了的數據接口不能滿足審計的要求的問題,審計人員應充分與被審單位信息系統(tǒng)管理人員進行溝通,了解電子數據格式,利用被審單位信息管理軟件平臺將數據導出轉換為符合審計要求的數據格式,或者通過ODBC等數據庫訪問接口,直接訪問被審計信息系統(tǒng)的數據庫,獲取電子數據,必要時聯系軟件系統(tǒng)開發(fā)企業(yè)的有關技術人員幫助解決。
2.命名規(guī)則性較差的電子數據文檔,通常不符合一般數據庫、表、字段等名稱的命名格式,一方面需要審計人員閱讀有關的應用軟件開發(fā)或系統(tǒng)數據庫維護文檔,獲取數據表文件及包含屬性的含義,另一方面,在無法獲取文檔幫助的情況下,需要審計人員通過文件中具有明顯特征數據內容找出重要的帳表文件,推導出部分屬性含義,再根據這些屬性找出其他關聯文件。
3. 數據缺失的處理根據不同的情況,有以下解決方法:
?。?)對于那些包含大量空值的列的電子數據,不僅不能給審計人員足夠的信息,反而會影響審計效率和執(zhí)行的效果。解決這一問題的方法之一就是刪除那些包含大量空值的列。(2)使用一個固定的值填充缺失值:所有空缺的值用一個常量代替。這種方法雖然簡單,但只適合缺失值不多的情況。
(3)使用屬性的平均值填充缺失值:對同一個屬性的所有缺失值都用該屬性的平均值代替,使替代值更接近缺失值,以降低誤差。
(4)使用推導值代替缺失值:若某屬性的取值只有少量幾種,就可以計算這幾種屬性值在該屬性中所占的比例,并對該屬性中的缺失值同比例隨機賦值。這種方法較適合缺失屬性為邏輯型的情況。
?。?)使用最可能的值代替缺失值:可以利用回歸分析、決策樹或貝葉斯形式化推導方法等建立一個預測模型,然后按照這個模型的預測值填充缺失值。這種方法相對比較復雜,但卻最大程度地利用了現存數據所包含的信息來預測空缺值,具有很好的效果。
4.屬性異常通常在數據的遷移過程中不易被發(fā)現,往往是審計人員在對電子數據進行分析時取值失真才意識到問題的存在,有些是該屬性字段下的所有數據格式都發(fā)生變化,有些是部分數據格式異常,對于這兩種情況都可以將該屬性字段下的所有數值格式全部選取進行格式轉換,避免尋找個別數據元進行操作的復雜性。
5.對于冗余記錄的處理,一般要經過以下兩個步驟: (1) 通過實例匹配找出表示現實世界同一實體的相似記錄。(2) 將相似的記錄合并到包含所有相關屬性并沒有冗余屬性的記錄中。對于同一實體中冗余屬性的處理,可以通過屬性間的相關分析來刪除冗余屬性。最常用的相關分析方法是計算屬性間的相關系數。如果屬性A和屬性B的相關系數大于設定的閾值,則表明A和B具有較強的相關性,A(或B)可以作為冗余而去掉。同時還可以運用技術手段刪除冗余屬性,如運用判定樹歸納方法選擇屬性子集,由源數據構造判定樹,不出現在樹中的所有屬性被認為是冗余的,出現在樹中的所有屬性形成歸約后的屬性子集。
6.所謂數據值異常,就是遠離或者超出某列分布規(guī)律的數據,主要表現為孤立點的存在,所以對于數據值異常處理的主要任務就是檢測出孤立點。由于孤立點可能是數據質量問題導致的,但也可能反映了事物背后某種異?,F象的發(fā)展變化,在面向數據的計算機審計中,孤立點可能預示著某種審計線索。所以在檢測出孤立點后必須再由人工判斷檢測出的孤立點是否為事實上的孤立點。若為事實上的孤立點,則可將孤立點視為干擾數據而丟棄,或者運用數據平滑技術按數據分布特征修正源數據。對于孤立點的檢測,若數據量較小,可以人工進行檢測,但當數據量很大時,就需要運用計算機技術和統(tǒng)計學相關原理進行檢測,例如使用 Benford法則對企業(yè)的大量費用支出情況進行檢測發(fā)現的孤立點。
7.數據模式沖突、數據語義沖突以等問題,在分析時常常涉及到對各數據源中的原始表及其有關屬性進行模式重構工作,審計人員可以利用AO現場審計實施系統(tǒng)的強大分析功能,對被審計單位的電子數據的某些屬性進行分解、合并、展開等工作,以達到各個數據文件形成一致集成模式的目的。
下一篇:關于審計機關內部管理機制的探討
Copyright © 2000 - m.yinshua168.com.cn All Rights Reserved. 北京正保會計科技有限公司 版權所有
京B2-20200959 京ICP備20012371號-7 出版物經營許可證 京公網安備 11010802044457號