• 联系电话
  • Product Advantage

    产品优势

    采集能力强大

    支持云端部署,24*7高效稳定采集,结合API可无缝对接内部系统,可灵活调度任务,顺利爬取海量数据。

    智能自动防封

    高度智能,自动破解多种验证码,提供代理IP池,结合UA切换,可有效突破封锁,顺利采集数据。

    多种终端采集

    多种应用领域文本,图片及网页数据眼见即可采,支持所有业务渠道的爬虫,满足各种采集需求。

    操作简单易用

    简单拖拽配置,完成爬虫任务设计,支持多种格式一键导出,快速导入数据库。

    Product Function

    产品功能

    互联网信息抓取

    互联网已成为海量信息的载体,互联网上存在大量情报信息

    企业重大事项、招拍挂、财务变动、股权分配等信息都会在互联网上找到线索。尤其是对大型企业、上市公司而言,通过互联网披露其相关信息,将对企业经营、股票行情产生重大影响。因此,通过对互联网上信息高效率的提取并筛选出有效涉税数据,为税务机关有效利用也是情报管理的目的。

    各类网站抓取

    主流网站、新闻财经、企业门户网站及政府门户网站抓取

    互联网网站众多,存在海量各类信息。根据统计结果。按现有技术,不可能对这么多的网站进行遍历搜索。因此,我们缩小涉税情报的搜索范围,将范围设定为大型新闻网站(如搜狐、网易、新浪)、大型财经网站(如东方财富、大智慧、西部产权网)、大型电商平台(如天猫、淘宝、京东等)、企业门户网站、及市级的政府网站等,作为涉税情报搜索目标。

    重大信息抓取

    知明企业、重点税源、重大事项信息抓取

    一是将集团类、股份制、关联企业及纳税排行榜企业(如纳税排行500名)确定为搜素对象;二是对未在列明企业内,但有重大事项的企业也锁定为搜素对象,从而保证涉税情报最大效益性。三是设定如企业名称、交易类型、重大事项等关键字作为“网络爬虫”页面提取程序,对指定网站页面信息进行搜索,将搜索出的数据作为情报来源。如搜素XX集团的土地交易事项,则以“XX集团”、“土地交易”关键字进行定向搜素,则将网站页面上涉及“XX集团”和“土地交易”的网页信息,作为涉税情报依据抓取下来。

    情报分析、数据匹配

    互联网信息量大,信息内容鱼目混杂,需要将这些涉税情报信息进行匹配和加工处理后方可利用。可采用两种方式对涉税情报数据进行匹配和处理:一是可将涉税情报处理平台作为互联网涉税情报数据采集渠道,采集并识别的情报数据作为内部综合分析应用平台的数据源,在内部综合分析应用平台中完成情报数据的匹配和处理;二是在涉税情报处理平台中完成情报数据匹配和处理。

    涉税情报分类到户,按户归集

    建立纳税人涉税信息“情报池”,将纳税人所涉及的相关情报按户归集,在情报池中进行统一归类、统一监督、统一管理。可按照不同权限、岗位需要从情报池中提取情报、加工分析后根据需要处理,信息核实后可以统一并入纳税人风险评估的风险池中,由基层进行评估处理。情报池可在内部综合分析应用平台中实现,或者在涉税情报处理平台中构建。