近年来,公务用车加油支出不断规范,公车私用问题得到遏制,但“车轮上的腐败”仍时有发生,体现形式主要是公油私用。审计发现,公车加油支出违规违纪问题已由明转暗更加隐蔽,这就要求审计人员必须及时转换思路,深挖细究,才能发现问题线索。公车加油审计需将审计期间全部车辆的加油报销单与公车使用管理台账、单位人员信息表等进行对比分析,表单多,数据大,传统的手工抽样方式很难实现审计全覆盖,存在较大的审计风险。运用Python的数据处理、分析等技术优势,可以更高效地查实“公油私用”等违纪问题。
一、通过Python技术破解公务用车加油审计难点
在的公务用车油费审计项目中,尤其是在对市(区)政府和部门单位领导干部经济责任履行情况开展审计时,每年相关资料的积累往往达到数千甚至数万件。面对会计凭证中大量的加油票据,审计组受限于人员和时间,难以全部审阅。小范围的抽查审阅难免忽略许多重要信息。利用传统手工记录筛选分析数据信息,工作量大,但对审计的实质性帮助不大,精准度不高。
针对以上痛点,常规的SQL、Excel检索难以满足数据分析需求,Python的优势性就体现出来了。Python是一门应用非常广泛的计算机语言,在数据科学领域具有无可比拟的优势。Python正在逐渐成为数据科学领域的主流语言。Python数据分析具有以下几方面优势:一是语法简单精炼。对于初学者来说,比起其他编程语言,Python更容易上手。二是有许多功能强大的库。结合在编程方面的强大实力,可以只使用Python这一种语言就可以去构建以数据为中心的应用程序。三是不仅适用于研究和原型构建,同时也适用于构建生产系统。研究人员和工程技术人员使用同一种编程工具,能给企业带来显著的组织效益,并降低企业的运营成本。四是Python程序能够以多种方式轻易地与其他语言的组件“粘接”在一起。例如,Python的C语言API可以帮助Python程序灵活地调用C程序,这意味着用户可以根据需要给Python程序添加功能,或者在其他环境系统中使用Python。五是Python是一个混合体,丰富的工具集使它介于系统的脚本语言和系统语言之间。Python不仅具备所有脚本语言简单和易用的特点,还提供了编译语言所具有的高级软件工程工具。
Python具有丰富和强大的库,它常被称为胶水语言,能够把用其他语言制作的各种模块很轻松地连接在一起,是一门更易学、更严谨的程序设计语言,常用于数据分析、机器学习、矩阵运算、科学数据可视化、数字图像处理、网络爬虫、Web应用等;R语言常用于统计分析、机器学习、科学数据可视化等;MATLAB则用于矩阵运算、数值分析、科学数据可视化、机器学习、符号运算、数字图像处理及信号处理等。
二、Python技术运用在公务用车加油审计中的思路
(一)数据采集
将加油票据进行拍照处理为图片信息,运用Python技术进行图片文字提取,用到的工具包有PIL,pytesseract,tesseract-ocr。PIL是图片处理库,pytesseract是OCR识别库,tesseract-ocr是文字识别库。导入以上库后,可以进行加油票据图片的编辑,提取文字、数字等信息。
(二)数据处理
将提取出来的加油票据数据信息进行筛选,利用关键字筛选法,筛选掉数据中的无用信息,筛选出审计需要的关键信息。比如“地点”、“时间”、“金额”等关键词。
(三)数据分析
审计组通过总结以往“公油私用”审计中发现的问题,列出四个关注点:一是加油时间是否异常,是否存在节假日、周末和非工作时间加油的情况。二是是否存在一段时间内连续加油的情况。三是是否存在异地加油的情况。四是是否存在其他身份人员加油的情况。
(1)法定节假日加油。将法定节假日库导入Python,通过关键词“时间”,将数据处理的全部加油时间与法定节假日库进行比对,筛选出节假日加油记录。再将筛选出来的记录与派出单、公务用车管理台账核对,审查是否存在法定节假日加油的违规问题。
(2)周末加油。通过关键词“时间”,将加油记录中的时间信息快速提取,利用Python “week_day”函数将交易时间转化为周一到周日格式,并统计周一至周日加油次数,输出周末加油记录。再将筛选出来的记录与派出单、公务用车管理台账核对,审查是否存在周末加油的违规问题。
(3)非工作时间加油。通过关键词“时间”提取一天不同时间段的加油记录,并筛选非工作时间加油次数及记录。再将筛选出来的记录与派出单、公务用车管理台账核对,审查是否存在非工作日加油的违规问题。
(4)连续加油。多日连续加油和一天多次加油都属于连续加油。利用Python筛选出连续N日(N>2)、一天N次加油的记录。再将筛选出来的记录与派出单、公务用车管理台账核对,审查是否存在连续加油的违规问题。
(5)异地加油。通过剔除关键词“乐陵”提取异地加油记录,并统计异地加油次数、加油量。再将筛选出来的记录与派出单、公务用车管理台账核对,审查是否存在异地加油的违规问题。
(6)其他身份人员加油。包含非本单位人员加油、非公务员身份加油和非在职人员加油。将上面5种方式发现的违规加油记录整理出来,在原有基础上添加上人员姓名和身份生成新的加油记录,利用关键词“身份”将新加油记录与在编在岗人员信息表进行比对,筛选出非公务员身份的加油记录。
三、Python技术在公务用车加油审计中的应用成效
(一)数据整理快速高效。公车加油审计中,加油票据多达数万张,数据量大且分散,利用Python图片提取数据的方法,可快速处理这庞大的数据集,更容易实现自动化分析,大大提高了数据搜索、整理、处理的效率和质量。
(二)结果展示直观。将Python处理分析的加油记录结果直接以Excel表格显示输出,直观清晰的展示出来违规记录。
(三)代码可继承性。公务用车加油审计中,利用Python代码分别得到了非工作时间加油、异地加油、连续加油等数据。代码格式是固定的,可以将代码进行保存重复利用,在下次公务用车加油审计中稍加修改就可以直接使用,具有极高的可继承性。
原文链接:http://audit.shandong.gov.cn/art/2023/12/29/art_89388_10367230.html
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。