介绍了民航英语教学语料库建设的现状与挑战,指出其面临专业门槛高、时间成本高以及教学应用局限等问题。同时阐述了大语言模型的兴起为解决这些问题提供了新路径,强调了其在处理海量语言数据、文本生成、翻译和分析等方面的优势,并说明了本研究旨在评估大语言模型在民航英语教学语料库建设各环节的实际效能,提出了三个核心研究问题。
首先探讨了人工智能与大语言模型在语料库建设中的应用研究,指出自然语言处理技术长期用于语料库基础工作,随着技术发展,人工智能介入更复杂环节,如语料采集、文本清洗等。国内学者也尝试引入人工智能技术构建语料库,大语言模型展现出跨领域知识整合能力,但针对专门用途英语教学语料库系统建设的研究仍不足。接着,章节讨论了民航英语教学语料库的应用现状,强调其在专门用途英语教学领域的应用研究呈增长趋势,民航英语教学依赖真实语言资源,语料库在术语教学与专业语篇理解方面有潜力,但现有研究多依赖小规模语料库,缺乏对新兴智能技术在民航英语语料库建设与术语教学中作用的系统实证研究。
本章节详细阐述了大语言模型在民航英语教学语料库建设与应用中的研究设计与实验方法。研究分为语料库建设和教学应用两大阶段,采用定性与定量相结合的方法,对大语言模型在语料采集、处理、对齐及教学应用等方面的表现进行系统评估,并与传统方法进行对照。实验选用豆包、Kimi和DeepSeek三款大语言模型,以国际民航组织的权威文件为基准语料,确保实验数据截至2025年6月30日。实验控制方面,设计了统一的基准提示语,并根据各模型的指令遵循能力进行微调。在语料库建设阶段,主要评估大语言模型在语料采集推荐、预处理(降噪)和双语对齐方面的效率与准确性,并设置传统人工+Tmxmall等工具的对照组,通过记录处理时长和计算对齐准确率等数据指标进行量化对比。在教学应用阶段,着重验证大语言模型如何基于语料库辅助开发新的教学应用,包括生成教学资源和工具、进行术语共现词汇统计和语境示例提取、构建“教学适配度三维过滤模型”筛选例句以及生成多样化的测试题目,并通过人工审核评估其可行性、适配度和实用性。
本章聚焦于大语言模型在民航英语教学语料库建设中的应用,涵盖语料采集、处理与对齐环节。在语料采集方面,大语言模型能针对特定教学场景推荐适配度高的语料,如空管运行和安全管理场景,且能抓取网页公开文字资料。语料处理环节,大语言模型可对PDF文件进行降噪处理,但存在长文本截断和表格图表识别错误等问题,通过人工预处理和文档拆分策略可提升文本可用率。语料对齐方面,大语言模型在处理ICAO标准文件的中英双语语料时,展现出高准确率和效率,尤其豆包和Kimi表现稳定,优于传统人工加对齐工具模式,且能输出便于后续研究和使用的XML格式文本。
本章聚焦于大语言模型辅助的民航英语教学语料库在教学中的应用,主要从术语教学、教学例句筛选和试题生成三个方面展开。在术语教学方面,大语言模型与语料库结合,解决了传统教学中“一词多义”和“近义辨析”的难点,以术语“clearance”为例,通过分析语料库中的双语语料,生成包含语境示例和搭配词云图的可视化教学资源包,降低了教师使用语料库的门槛。在教学例句筛选上,设计了“教学适配度三维过滤模型”,从句长、词汇难度和领域相关度三个维度实现例句的智能筛选,突破了传统人工筛选的局限。在试题生成方面,大语言模型基于专业语料库,能够智能生成高质量、多维度的测试题目,减轻了教师命题的负担,提升了测试的专业效度和覆盖面。
本研究通过实证实验,验证了大语言模型在民航英语教学语料库建设与应用中的高效性和准确性,降低了语料库建设成本,开发了多种教学应用工具。但研究存在局限性,如模型版本的局限和缺乏长期教学实践应用。未来研究需探索更多模型版本,并将智能工具嵌入教学实践进行深入评估。
* 以上内容由AI自动生成,内容仅供参考。对于因使用本网站以上内容产生的相关后果,本网站不承担任何商业和法律责任。