【任务】 关于知识分享社区的数据采集 正常
> gyiang 写到: > 当前各类社区的数量: > 资讯类:国内2、国外1 > 博客:1 > 问答类:7 > 论坛:1 > 其他:1 > 总体数据量不大,去除stackExchange站点群的数据后, > 其余数据相加不足200万。 可以!先让整个系统动起来,然后再横向扩展。 谷崇明等Demo框架差不多时,还是回归爬虫框架吧,你认为呢?
当前各类社区的数量: 资讯类:国内2、国外1 博客:1 问答类:7 论坛:1 其他:1 总体数据量不大,去除stackExchange站点群的数据后, 其余数据相加不足200万。
正在整理爬取进度
© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号
加入QQ群
关注微信APP
预览