请问某些资讯网站的实时财经新闻(如金十数据)是如何做到的?是用爬虫对相关网页实现的吗?
不,知名的通讯社和新闻媒体不是依靠技术手段进行处理。
大部分普通媒体都是通过通讯社的终端或者咨询公司的终端(后台)收集信息,只进行简单编辑就发送。
四大社都是编辑世界的新闻机构,以美联社为例,全球200多个分社记者站,确保在世界范围内有新闻都会第一时间得到消息(合法的不合法的手段,人脉关系,公关等),然后各大媒体通过通讯社获取到新闻源后再考虑是否投入能力进行深度报道,如果是简寻的话,通讯社的编辑后发送即可。
咨询和分析、顾问公司,汤森路透和彭博社一样,也是类似与通讯社一样的获取方式,但是彭博社本身也提供平台功能,也可以发布。
然后最前沿的记者和采编,需要通过分析财报,与企业之间的人脉关系,其中相关行业的公开发布是主要来源,然后是人脉之间的互相交流(比如采访并购的获取到了非并购的新闻,他所在的媒体也不关注这类内容,他就可以与其他记者交换),网络消息(新媒体、微博的线索追踪和快报),最后还有少量的知情人爆料
当然某财什么的那种自我加工的也存在。
当然还有纯编辑工作的,就是转载发送的,这种主要通过爬虫收集,因为小公司的规模和访问量,不存在新闻伦理和法律上的紧迫问题(比如禁止转载等)。