开题报告是指开题者对科研课题的一种文字说明材料。这是一种新的应用写作文体,这种文字体裁是随着现代科学研究活动计划性的增强和科研选题程序化管理的需要而产生的。开题报告包括综述、关键技术、可行性分析和时间安排等四个方面 。开题者把自己所选的课题的概况(即"开题报告内容"),向有关专家、学者、科技人员进行陈述。然后由他们对科研课题进行评议。
一、研究背景及研究意义
信息技术的快速发展加速了教育信息化的进程,在线教育系统与测试系统的出现为学生提供了一个可以提高和检测综合能力的便捷途径。另一方面,C语言教学在各大高校中都是必修课程之一,且在计算机相关课程教学中,针对某个理论性的知识点的考察,一般会以客观题的形式给出。由于答案具有唯一性,通过简单得匹配方式便能识别正确与否从而给出相应成绩。针对这类客观题的自动评分技术已经相当成熟,因此后续在自动评分方向的研究中主要集中于主观题的自动评判。在过去几年的积极探索阶段到现有的实际研究成果来看,有关C语言知识的检测中对编程题的考察是必不可少的。虽然检测的形式各不相同(填写空缺代码块完成完整程序,按题目要求编写整个程序),但终究是为了考察学生掌握编程技巧及编程思想的程度。
本课题研究的主要目的是结合编程实现的特征,为一个正在初始运营中的在线测试平台提供一个能查重与自动评分的功能模块。其中最终评分包括两个部分,一是对每个学生提交的程序代码文件相互之间进行相似度检测,当相似度超过预定阈值作为抄袭处理,此为查重检测。二是将学生程序与模板程序匹配检测相似度并由此计算最终得分。
程序语言与自然语言在各自适用领域上有较大差异,其语言虽然都有词法、语法规则等,但编写程序语言时并没有自然语言那么的灵活,不会出现一词多义,一义多词,他只有固定的关键字,标识符编写规则,功能实现结构等,所以较于自然语言来说识别起来要容易一些。国内外对编程题相似度检测及自动评分都有不少的研究,现也有一些系统比较成熟。
目前,各大高校对C语言课程考察方式一般还是以传统的纸质化考试为主。
这样的考试方法在人工阅卷的过程中存在着些许的不确定因素,随着教育的普及,能力测试之后需要批改的试卷绝不是一个小数目。这单一单调的工作很容易使得批改人员疲惫不堪,从而阅卷出错率将会被动的提高。利用计算机完成自动阅卷将杜绝这一问题的出现,同时,其运行速度快能及时的给学生反馈结果也没有人的感官情绪,能公平公正的对待每一份试卷。
对于主观题的自动评分技术还在不断的完善中,由于在主观题的识别所需的技术:人工智能、自然语言处理、模式识别等还处于起步阶段。所以主观题自动阅卷技术不能一蹴而就,还需要不断的实验研究。目前,探索开发出合理试用的主观题自动评分系统是一个技术难题,若能将开发的系统投入教学或是别的考察里面,将会大大的节省人力物力。
二、国内外研究现状
国外对文本相似度检测的研究早国内,在20世纪中期,就有学者提出让计算机同人工阅卷一般来对主观题如作文进行评阅。至今,经过数多学者的致力研究,出现了许多与教育结合的应用系统,并已投入使用。在对自然语言的文本分析处理方法的研究同时,随着计算机教育的普及,程序代码的检测也在逐渐兴起。
1966年,Ellis Page开发了一个模拟人工评分的系统Project EssayGrade(PEG),该系统是总结学生提交文本的特征向量,然后将文本的特征进行量化,最后根据量化的结果对其文本进行判分。
1967年,Halstead提出了用属性计数法计算程序代码之间的相似度,所谓的属性是指代码的某些度量值,如:空行的数目,字符量,语句量,控制结构量等,在他的研究基础之上,1977年Otteiistein设计了检测FORTRAN编程语言的代码抄袭检测系统,该系统基于属性技术的相似度检测技术。基于属性技术求解程序代码之间相似度的系统还有Faidhi和Robinson的程序抄袭检测系统,以及Grier设计的Accuse程序抄袭检测系统。
单方面只考虑属性计数而忽略程序的结构组成,得出的代码相似度比值准确率较低,在1996年,Verco和Wise对Accuse程序抄袭检测系统进行了一系列可能性的测试,通过在源程序中加入不影响代码运行的字符串或用其他结构代替原结构等方式。在对测试结果分析研究之后指出:只是单纯的增加供于检测的程序属性数量,在程序相似度检测中并不能得到更加精确的检测结果。
G.Whal首次提出了程序结构方向的研究思路,通过分析程序的内部结构来匹配两源代码之间的相似度。在此后,学者们朝着这两个方向开始研究,同时也有将二者结合研究的。
G.Whal设计的Plague系统,Micheal Wise设计的YAP3系统,Sim系统都是采用的程序结构度量技术进行研究。Donaldson是结合了属性技术与程序结构度量两种技术完成对程序相似度的检测。
还有用token(标记)序列来表示程序的字符串匹配算法,是根据编译原理技术,将程序的语句进行分词的操作,然后将得到的单词存入token序列。然后使用字符串匹配算法计算相似度。常用的字符串匹配算法有:最长公共子序列(LCS)算法、余弦算法、编辑距离(Levenshtein)算法等。采用这种方法的有Duploc、NICAD、Dup、Clone
现在使用比较广泛是Online Judge系统,简称OJ,是一个在线的判题系统,系统通过对用户提交的代码进行编译和运行,对于能够运行的程序通过预先设定的测试集来检测代码运行的结果,以及运行时间是否在规定范围之内。该系统最早使用在ACM-ICPC国际大学生程序设计赛和 OI 信息学奥林匹克竞赛中。该系统的返回结果有7种:Wrong Answer:答案不完全正确;Time Limit
本文的主要研究内容以及创新点有:
1)研究文本相似度检测技术,分别比较点阵图法、空间向量的余弦算法、最长公共子序列LCS算法、最小编辑距离Levenshtein distance算法对源程序相似度检测效果。提出基于LCS的C语言程序查重算法。并对源代码进行适用于LCS算法匹配的预处理操作,改进匹配方式以提高算法匹配效率,提取源代码的特征属性求解阈值。
2)研究程序识别相关技术,以及自动评分的两种常见方法:动态评分;静态评分。本文主要研究静态评分方法,将程序抽象提取为SDG的表现形式,分析结构语义对源代码进行预处理,并提出基于控制流程匹配度的C语言自动评分算法。
3)分析C语言程序的结构,分析抽象语法树的表现形式,将程序划分为多个不同粒度的子程序,并转换为结构树。运用编译原理技术分析数据依赖、控制依赖完成树的构建。因此提出基于最小子程序匹配的C语言自动评分算法。
1.1研究背景及研究意义
1.2国内外研究现状
1.2.1国外研究现状
1.2.2国内研究现状
1.3本论文的主要研究内容
1.4论文组织安排
第2章相关理论及技术介绍
2.1.1正则表达式的符号元
2.1.2正则表达式的使用的规则
2.2编译原理技术
2.2.1词法分析
2.2.2语法分析
2.2.3语义分析
2.3.1结构化程序设计
2.3.2程序流程图
2.3.3程序依赖图
2.3.4系统依赖图
2.4.1C语言程序设计
2.4.2C语言结构特点
2.4.3C语言基础概述
2.4.4C语言代码多样性分析
第3章基于LCS的C语言程序查重算法
3.1代码抄袭概述
3.2抄袭常用方法
3.3源代码查重预处理
3.4程序代码查重算法
3.4.1文本相似度算法
3.4.2LCS最长公共子序列
3.4.3阈值分析
3.4.4检测代码重复率
3.4.5算法分析
3.5实验结果及分析
第4章基于流程控制匹配的自动评分算法
4.1流程控制结构图
4.1.1流程控制结构划分
4.1.2流程控制结构划分细节说明
4.1.3结构依赖关系划分
4.1.4结构依赖关系划分说明
4.2程序流程控制结构图
4.2.1代码预处理
4.2.2自定义函数分析
4.2.3生成流程控制结构图算法
4.3程序流程控制结构图匹配算法
4.3.1匹配单位元素定义
4.3.2程序代码自动评分算法
4.3.3算法分析
4.4实验结果及分析
第5章基于最小子程序匹配的自动评分算法
5.1子程序的概述
5.1.1子程序的定义
5.1.2定义基本语句单元
5.2基于结构树的程序中间表示
5.2.1代码预处理
5.2.2结构树定义
5.2.3生成树状图算法
5.3最小子程序匹配评分算法
5.3.1划分最小粒度子程序
5.3.2子程序匹配描述
5.3.3子程序匹配的自动评分算法
5.3.4算法分析
5.4实验结果及分析
整个论文包含个章节,整体组织结构如下所示:
第一章绪论,根据研读的国内外文献简要描叙一下本文所研究主题的背景、意义,然后介绍国内外相关研究方法及成果,以及自己研究的内容简介。
第二章介绍了完成本文实验的相关理论知识:正则表达式的应用、编译原理技术、程序与图的关系、C语言编码特性、多样性等。
第三章介绍程序查重算法动态求解最长公共子序列。
第四章介绍了基于流程控制匹配的自动评分算法第五章介绍了基于最小子程序匹配的自动评分算法。
第六章总结了整个算法实现过程中主要工作,分析优缺点,并对后续的工作进行展望。
20xx年11月08日-11月20日 初步收集毕业论文相关材料,填写《任务书》
20xx年11月26日-11月30日 进一步熟悉毕业论文资料,撰写开题报告
20xx年12月10日-12月19日 确定并上交开题报告
20xx年01月04日-02月15日 完成毕业论文初稿,上交指导老师
20xx年02月16日-02月20日 完成论文修改工作
20xx年02月21日-03月20日 定稿、打印、装订
1、本课题的理论意义:
在桥梁工程施工阶段,测量工作的任务是直接为施工服务。测量放样的前提除了要有内业计算资料外,还要满足施工放样精度要求,控制点密度适当,图形结构良好的施工控制网更是必不可少,而且施工控制网的布设形式和精度等级更直接影响桥墩放样点位的精度,从而更构成了桥梁建设成败的一个关键因素。因此如何更科学地设计与布设一个既经济又合理的桥梁施工控制网显得极为重要。
2、国内外本课题的研究动态:
桥梁施工控制网作为整个大桥建设的基础必须保证高精度与高可靠度,这种控制网的特点是:网点间边长较短,点位精度要求却甚高。过去一般采用常规的边角网,为了达到高精度与高可靠度一是要考虑网形结构的优化,另外就是要花相当的工作最进行网的观测,特别随着桥粱的跨径越来越大,常规测里仪器在测程上也逐渐不能胜任,这就要求测绘工作者寻找新的工作方法。近年来,在越来越多的高速公路的兴建中,相继应用GPS定位技术来建立线路控制网。与常规测量方法相比,这项技术不仅显著提高了线路控制点的精度和可靠性.而且可大大提高速度及减少费用。这对于高速公路勘测设计和施工放样具有重大的现实意义。同样GPS用于桥梁控制网的建立也逐渐从最初的试验尝试到现在的普篇应用,取得越来越显著的成绩。如润扬长江公路大桥、南京长江第三大桥、苏通长江公路大桥、杭州湾跨海大桥等首级施工平面控制网的建立都采用了GPS技术。
目前大型桥梁施工控制网的建立方法主要有两种:一种是传统的三角网的方法,另一种是利用GPS技术建立。这两种方法在许多大型工程项目中都得到了成功的应用,但各有特色。
传统的三角网建网方法有许多优越性,如:观测量直观可靠,数据处理方法简单,有一整套成熟的建网技术和观测程序,测量精度比较容易控制,工程经验也较多等等。但该方法作业速度比较慢、测量的周期相对较长,人力物力的投入也比较大,在观测上受气象条件影响较大,在成果质量上受人的因素影响较大。所以人员因素和工作效率就成为传统三角网的致命弱点,尤其在当前的市场经济条件下,工程项目周期都比较紧张,留给测量作业的时间更是少之又少,外业测量时间相当紧迫,并且大型桥梁施工控制网都是长距离跨江或跨河,对气象条件要求较高,每天可观测的时间又有限,因此客观上在精度能够满足需要的情况下应该尽量避免使用该方法。利用GPS技术建立控制网,恰恰弥补了常规传统三角网方法建网的不足,在减轻劳动强度、优化设计控制网的几何图形以及降低观测中气象条件的要求等方面具有明显的优势,并且可以在较短时间内以较少人力消耗来完成外业观测工作,观测基本上不受天气条件的限制,内、外业紧密结合,可以迅速提交测量成果。但是并不是所有桥梁工程都可以采用GPS技术建立测量控制网,比如在卫星接受信号较弱的工程或对控制网点位精度有特殊要求的工程就难以采用。
1.城市E级GPS网的测定;
1)GPS网点的确定 2)E级静态GPS网的外业测量
3)静态GPS数据处理
2.桥梁施工控制网的设计要求;
1)相关测量规范 2)精度、等级要求 3)方案设计(控制点的选择等)
3.桥梁施工控制网的外业测量过程与注意事项;
1)平面控制测量 2)高程控制测量(过河的二等水准测量)
3)测量过程的注意事项
4.桥梁施工控制网的内业计算与精度评定(绘制出桥轴线的相对误差椭圆曲线)
1)平面和高程控制测量的内业计算,整理外业测量成果
2)精度评定(绘制出桥轴线的相对误差椭圆曲线)
5.桥梁施工控制网的优化设计(增减条件量进行比较计算)。
通过调查文献获得资料,从而全面、正确地了解掌握各平差方法比较分析的动态信息。
利用测量仪器和设备,在自然条件下,通过有目的有步骤地操纵,根据观察、记录、测定与此相伴随的现象的变化来确定条件与现象之间的因果关系的活动。主要目的在于说明各种自变量与某一个因变量的关系。
根据观测所得数据的一些数量关系的分析研究, 认识和揭示事物间的相互关系、变化规律和发展趋势,借以达到对事物的正确解释和预测
4、模拟法(模型方法)
用已有的观测数据建立数学模型,通过模型算出预测值再跟实际测出的值进行比较分析,通过模型来间接研究原型。
完成期限和采取的主要措施:
1. 7-8周 参与实际项目生产作业,以获得观测数据。
2. 9周 对观测数据进行预处理,确保无误并符合限差要求并消除系统误差。
3 10-11周 桥梁施工控制网的内业计算与精度评定(绘制出桥轴线的相对误差椭圆曲线)
4. 11-12周 对桥梁施工控制网进行优化设计。
5. 13-16周 撰写论文、修改、定稿,答辩。
[4] 张正禄等编著.工程测量学[M].武汉:武汉大学出版社,20xx
[5] 张华海等编著.大地测量学[M].徐州:中国矿业大学出版社,20xx
[6] 郭际明.孔祥元.控制测量学上、下册(第三版)[M].武汉:武汉大学出版社,20xx
[7]张坤宜主编.交通土木工程测量(修订版)[M].武汉:武汉大学出版社。20xx
[8]武汉大学测绘学院测量平差组编著.误差理论与测量平差基础[M].武汉:武汉大学出版社,20xx
[9]费业泰主编.误差理论与数据处理[M].北京:机械工业出版社,20xx
[10]李征航.黄劲松编著.GPS测量与数据处理[M].武汉:武汉大学出版社,20xx
[11]潘正凤等编著。数字测图原理与方法(第二版)[M].武汉:武汉大学出版社,20xx
论文(设计)名称 :浅谈《骆驼祥子》中祥子的多重悲剧
一、研究或设计的目的和意义:
目的:为了进一步对本课题的理解,加深对所学专业的基础理论、基本技能和专业知识的掌握,进行对《骆驼祥子》中祥子的多重悲剧的研究。
意义:通过对小说《骆驼祥子》中祥子这一悲剧人物形象的研究以及相关资料的思索,促进广大读者对这一小说内容更深入透彻的理解,从而了解作者当时写作这一作品的时局和背景,了解当时的旧中国是什么现状,当时旧北平底层劳苦人民是怎样艰难的生活着,更进一步反映了当时社会的混乱,给底层劳苦者带来的苦难,让读者们能了解中国的历史,同时也抒发了作者对社会底层穷苦劳动者的关怀和同情,唤醒还在沉睡的人们,让读者们能有所思考和感悟。
二、研究或设计的国内外现状和发展趋势:
国内现状:中国学者对《骆驼祥子》这部作品还在不断的分析和研究中,还带有很强的探索性质。
发展趋势:《骆驼祥子》这一不朽的作品深受广大的学者的青睐,这一作品正在戏曲舞台上蓬勃的发展,它的足迹遍及大江南北,这部作品被编排成京剧,取得了突破性的成绩,这既是对“样板戏”的突破,也是对传统京剧的突破,《骆驼祥子》是京剧现代戏发展史上的一个里程碑。
国外现状:外国专家、学者和广大观众都十分的喜欢这一作品,不少的的专家把《骆驼祥子》翻译成外文进行研究。
发展趋势:近年来,国外汉语界对老舍先生研究的热情日益高涨,不少的国外作家不仅研究老舍先生的一部作品,而是对他的多部作品着迷,深入研究、探索其中的语言风格,地域风情,《骆驼祥子》也获得了国际性的声誉。
三、主要研究或设计内容,需要解决的关键问题和思路:
研究内容:悲剧的定义;作者不幸人生的背景;祥子的多重悲剧。
关键问题:造成悲剧的原因;作品的写作背景是作者当时的社会状况的再现。
思路:对作品要十分的熟悉,叙述作品的大概故事情节;祥子是作品的主要悲剧人物,理解悲剧的含义;任何作品都离不开作者,了解作者写作的背景;悲剧是这一作品的主题,论述主要人物祥子的多重悲剧;总结 造成悲剧的原因。
四、完成毕业论文(设计)所必须具备的工作条件及解决的办法:
到图书馆查询参考资料,搜集相关题材的文献资料,报刊期刊 ,通过材料进行分析、理解,整理材料,更多是与指导老师多沟通;交流意见。结合课题的题材完成,广泛阅读与《骆驼祥子》相关的资料。