水淼·淘宝商品采集器 v3.0.0.0 - 采集淘宝商品销售数据输出报表软件介绍
水淼·淘宝商品采集器 v3.0.0.0 - 采集淘宝商品销售数据输出报表软件介绍
水淼软件出品的一款淘宝天猫商品信息批量采集软件
直接采集淘宝搜索页面数据,包括商品的价格、销量、销售额、旺旺号、商品标题、商品地址等等,输出为电商数据报表(csv文件),可用于分析电商行情、同行销售业绩评估等用途。
每个商品关键词支持100页,大约4400个商品的销售数据和宝贝属性。支持详细的搜索参数设置,支持多个商品关键词顺序采集,不同关键词使用|隔开
特别提示
淘宝弹出的窗口,第一次是用于登录,登录完成可以立刻关闭窗口继续采集;以后是用于输入验证码,支持自己打码和雇人打码(推荐雇人打码并等待)。如果验证码频出,则每次输入验证码后让窗口自动等待15分钟才能继续采集,否则就会一直弹窗口
本软件不支持导入淘宝助理的,请注意!
采集字段
默认字段
搜索页面里直接显示的字段,如旺旺号、价格、销量、销售额、评论数、地区、运费、标题、地址、商品图、卖家信誉、好评率、如实描述、服务态度、物流速度、级别、标签、店铺地址
扩展字段
有#标记的字段,如店铺名、原价格、成交记录、库存数、收藏数、产品参数、详情内容。如果采集此类字段会导致速度变慢
采集速度说明
软件是采集淘宝搜索页面数据(点击【浏览器打开】按钮就看到了),包括基本字段如价格、旺旺号、销量、标题、地址等等,不过有的扩展字段(#字段)不在搜索页面里,基本字段【销量】也不是实时值,就需要到多个数据源去读取扩展字段或基本字段的实时值
为了避免不同字段多个数据源一起采集影响整体采集速度,故有#的字段只有在被打钩的情况下才读取数据
其中【#原价格】【#成交记录】【#库存数】【读取销量实时值】 这四个字段某一项被打钩,其余3个都会一起读取(因为都来自同一个数据源,1个或4个项的读取速度是一样的,不同数据源才影响采集速度)
其中【#产品参数】【#详情内容】等扩展字段,【+购物车】【+有视频】等筛选条件均需访问商品页面再读取数据(二个步骤)
以上说明仅描述影响采集速度的各项因素,内部过程无需用户操心软件自动完成。
水淼淘宝商品采集器是一款可以直接采集淘宝搜索页面数据,输出为电商数据报表(csv文件),可用于分析电商行情、同行销售业绩评估等用途。
每个商品关键词支持100页,大约4000个商品的销售数据和宝贝属性。支持详细的搜索参数设置,支持多个商品关键词顺序采集。
水淼淘宝商品采集器功能:
第一步:设置采集参数
【商品关键词】:可以放多个顺序采集,如“女装|男装|主机”
【排除关键词】:就是目标商品标题不允许包含的关键词,同样可以放多个排除关键词,以对应商品关键词,如“连衣裙|T恤|I5”
【指定地区】:地区可以是省名如“广东”也可以是市名“广州”,如果需要给出多个地区可以用逗号“,”隔开如“广东,杭州,北京”
本采集系直接搜索淘宝并将网页里的数据精确提取出来
第二步:开始采集
采集页数:最多100页。大约每个关键词能采集 4000 个商品。
第三步:导出采集结果
你可以打勾需要导出的字段,也可以调整字段的先后顺序。这样在导出保存时将按照字段设置导出数据,导出对话框里选择csv文件时,将自动在首行添加报表列,其他格式不添加。打勾多关键词独立保存时,则不同关键词采集的数据独立保存到文件,文件名为关键词本身。其中的字段“月成交额”为“月卖出件数×价格”的结果
水淼淘宝商品采集器 更新:
升级记录(2017年3月22日):
1.7.0.0:增加信誉度、好评率、店铺名3个新字段采集。
1.7.0.1:修复右击开始采集按钮功能没有与左击功能同步的问题
1.7.1.0:修复淘宝改动导致采集失败的问题
1.7.2.0:增加类目ID搜索选项。
1.7.3.0:修正按关键词采集出现的重复项;修正字段排序错乱问题;增加右键开始采集按钮采集店铺商品时的图片链接等多个字段;其他更新。
1.7.4.0:修正关键词读取失败时如果取消尝试将全部停止采集的问题(增加多选项询问)。
1.8.0.1:同步最新淘宝搜索选项;增加代充判断(主要适用于QB等关键词);增加转换店铺地址选项;其他更新
1.9.0.2:重写改动多处代码;增加有视频选项;增加无词类目采集选项(不需要关键词只按类目采集)
1.9.1.0:修复因淘宝变动,打勾 读取扩展数据 复选框时,只能采集1页的问题。
2.0.0.0:更换新的商品地址采集器并修复因淘宝变动导致无法采集淘宝店铺的全部地址等问题。
2.0.0.1:细节更新
2.0.1.0:修复淘宝变动采集失败的问题。
2.0.1.1:尝试修复部分电脑取硬盘码失败的问题。
2.0.2.0:修复淘宝改动导致店铺采集ID失败的问题。
2.0.3.0:修复库存数量字段获取失败的问题。
2.1.0.0:修复多个字段获取实时数据失败的问题;增加成交记录字段获取。
2.1.1.0:修复淘宝的销量和成交记录获取失败的问题;修复淘宝的库存数量部分失败的问题。
2.1.2.0:修复淘宝改动搜索失败问题。
2.1.5.0:新增淘宝登录或验证码判断处理,修复采集失败问题(话说淘宝限制越来越严格,太抠了,尤其针对阿里云之类的VPS的采集限制更严格,验证码频繁甚至出个不停)。
2.1.7.0:弹出的验证窗口新增自动关闭选项(等待10分钟再自动关闭并继续采集)。根据测试,如果频繁弹出浏览器窗口,必须等待10分钟后再关闭窗口继续才可以又采集很长一段时间。所以第一次弹出窗口用于登录,登录之后可以手动提前关闭窗口,之后再弹出的浏览器窗口一般用于输入验证码,如果没有验证码,只是正常搜索页面,那可以打勾这个自动关闭选项,就会等待10分钟自动关闭继续采集;修改界面的一些组件参数。
2.1.8.0:新增搜索类型选项,可以设置所有、淘宝、天猫;修复部分天猫的产品参数采集失败问题。
2.1.9.1:修复验证窗口自动关闭选项的一些问题。
2.2.0.0:新增采集模式选择,并尝试修复部分内存得不到释放,长时间运行产生内存超出的问题;读取扩展数据的每个来源都修改为识别淘宝验证弹出,解决有些扩展数据读取失败的问题;修复弹出的淘宝验证窗口在主窗口激活时有时不能显示在最前面的问题;其他更新。
2.3.0.0:修复品牌词如豆浆机、纸尿裤等不能采集的问题,商品地址采集器新增检测登录或验证码的自动弹出,新增支持批量关键字采集(跟主界面一样使用|隔开多个关键字)。
2.3.1.0:修复综合排序只能采集一页的问题。
2.3.2.0:商品地址采集器新增支持非淘宝域名但关联到淘宝的域名的店铺采集,并修复天猫店铺因淘宝改动而采集失败的问题
2.3.3.0:修复评论数和库存数量部分获取失败的问题;修复淘宝采集不支持xp系统的问题(现在支持了)
2.3.5.0:修复淘宝成交记录因淘宝改动采集失败问题
2.3.6.0:新增排除关键词选项;修复多个选项因淘宝改动无效的问题
3.0.0.0:全新改版,代码完全重构,大力优化了整个采集流程
回复显示下载地址:
|