嗯,谨记~
jacknudt 写到: 很好!状态很好!大数据集的测试一定要注意:先在一个小规模测试上验证,同时增加运行阶段性结果的输出,同时尽可能是可退出后接着执行。这样会节省大量时间。
我将给依赖项目集赋id值、扩充依赖关系对字段将id+name作为项目的唯一标识、构造PageRank输入所需的矩阵、PageRank基本算法写在一个程序里了,所以运行效率不是很高,程序还在跑,好激动也好忐忑的等待着结果。同时,我学习了一下networkx的相关用法,为下一步实验做准备,另外与杨程师兄互相做了进展的阐述,并进行了深入讨论,明确了目标。(今天时间不是很多,上午开了会,下午政教体能写年终总结写学院大型活动的解说词)
1、数据集是来自github上的Java项目,筛选了根目录下中含有pom文件的项目。
2、项目指的是project.(我理解的github上project和repository是同一个意思)
3、依赖指的的是,Java项目用maven管理,会有一个pom文件,里边详细注释了该项目依赖了哪些包,(我理解的是该项目使用了、集成了其他一些项目)
jacknudt 写到:很好!我们每一步的进展都应该像这样:用数据说话
注意:请在issue的标题中就给出“突破性进展”这样的提示,容易抓眼球。
我有几个问题:
1、数据集是什么?
2、你的项目具体是指什么?是项目(project)还是版本库(repository)?
3、你说的依赖,是指什么?
很好!我们每一步的进展都应该像这样:用数据说话
注意:请在issue的标题中就给出“突破性进展”这样的提示,容易抓眼球。
我有几个问题:
1、数据集是什么?
2、你的项目具体是指什么?是项目(project)还是版本库(repository)?
3、你说的依赖,是指什么?