项目简介

本项目探究机器学习、深度学习等方法在软件工程研究问题中的应用,致力于在软件工程研究中运用更好的方法解决问题。

0?1442652658
【缺陷】 对比实验代码 正常
指派给   未指派
发布时间: 09/16/2018 21:25
更新时间:09/16/2018 21:36

##文件及说明

Bug_training_cm.py 论文对比实验代码

tfidf文件夹包含tfidf训练模型

training包含w2v以及d2v训练好模型

exper_filehash.sql为验证数据集

------------------------

训练集为5845条数据 ,测试集为650

效果不好的原因是因为一个bugid对应的相似bugid数量较少

( 103 MB) 陈明, 09/16/2018 21:21
回复 ︿ (1)
  • 用户头像
    胡东阳 1年前

    目前参考论文《Combining Word Embedding with Information Retrieval to Recommend Similar Bug Reports 》中的The Overall Framework 复现流程已经走通,但是在我们现在的数据集上测试效果欠佳,初步考虑原因是一个file对应多个bug_id的数据量较少。

0?1470885445
登录后可添加回复
17765?1483088285
【缺陷】 第一次讨论结果 正常
指派给   未指派
发布时间: 08/21/2018 22:34
更新时间:08/22/2018 09:04

1、第一阶段目标:运用document embedding (例如doc2vec)方法解决传统经典bug研究问题,例如bug localization、bug分类、bug指派等。传统方法主要是基于bug的自身属性或者利用传统的信息抽取方法(例如TF-IDF)来计算文本的相似度


2、经过调研,对于传统的bug localization问题,目前已有研究利用人工神经网络(例如word embedding, word2vec)方法来研究此类问题。但是word2vec方法只考虑了词与词之间的相似度,很难将一些bug的结构属性加入到模型中,但是doc2vec方法在word2vec基础上考虑了文档标签,所以可以将bug的属性很容易的加入到人工神经网络的模型中去,使模型参考因素更多,更加健壮。所以我们猜测doc2vec方法解决传统的bug localization问题效果会更好。


3、第一阶段计划:运用doc2vec方法对bug localization问题进行研究,并与前人的工作做对比,比如与word2vec方法做实验对比,验证我们实验方法的优越性。


4、下一阶段计划:我们在传统bug问题上走通后,再想办法移植到github上的新式研究问题,例如给用户推荐项目,预测issue的解决时间之类的。



( 255 KB) 胡东阳, 08/22/2018 09:01
( 861 KB) 胡东阳, 08/22/2018 09:01
( 450 KB) 胡东阳, 08/22/2018 09:01
( 1.77 MB) 胡东阳, 08/22/2018 09:01
回复 ︿ (4)
  • 用户头像
  • 用户头像
    胡东阳 1年前

    相关网站资料:

    1、https://blog.csdn.net/aliceyangxi1987/article/details/75097598

    2、https://blog.csdn.net/surehao/article/details/19623345

    3、https://blog.csdn.net/lk7688535/article/details/51321466

    4、https://blog.csdn.net/mpk_no1/article/details/72836024

  • 用户头像
    胡东阳 1年前

    attachment 07372035.pdf added

    attachment 07582745.pdf added

    attachment 07774514.pdf added

    attachment fse14.pdf added

    attachment Learning to Rank Relevant Files for Bug Reports Using Domain know.pdf added

    Description updated (diff)

    Status changed from 新增 to 正在解决

    % Done changed from 0 to 20

0?1470885445
登录后可添加回复
问题和建议
还能输入50个字符 Submit

加入QQ群

关注微信APP


×