全国服务热线:400-6863-912

位置:西安研课教育 > 海外实地科研项目> 金融科技课题:机器学习与NLP在金融市场预测中的运用

金融科技课题:机器学习与NLP在金融市场预测中的运用

金融科技课题:机器学习与NLP在金融市场预测中的运用

  • 开班时间:滚动开班
  • 课程价格:电话咨询
  • 培训周期:电话咨询
  • 上课地点:西安发送地址到手机上
在线咨询 预约报名

课程介绍

  金融科技课题:机器学习与NLP在金融市场预测中的运用

  Data Science: Machine Learning and Natural Language Processing

  课题难度:In-depth

  课题海报

金融科技课题:机器学习与NLP在金融市场预测中的运用人工智能·金融科技·量化金融·投资决策·信息提取·自然语言处理商业分析·消费者行为分析·违约风险分析32课时线下论文研讨+30课时科研课程+全程62课时教授亲自指导哥伦比亚大学教授Patrick Houlihan

  Course Arrangement

  课程安排

  招生状态:招生中

  课程时间:

  线上:2024-03-09 ~ 2024-06-22

  实地:2024-07-15 ~ 2024-07-26

  课程校区:美国 · 哥伦比亚大学校区

  课程形式:Neoschool平台直播 + 线下实地授课

  课时安排:5周科研策略与论文写作课程+10周专业知识拓展课程&2周考核+2周暑期实地科研实践,课程时长共109课时,为期19周

  Course Description

  课程描述

  课程背景

  机器学习是一种让计算机系统通过数据学习并改进性能的技术。自然语言处理是研究计算机如何理解和生成人类自然语言的领域。它的目标是使计算机能够像人类一样理解文本和语音,并能够与人类进行自然的语言交互。NLP的发展受益于机器学习和深度学习技术的进步,这些技术使得计算机能够更好地处理和理解自然语言。机器学习和自然语言处理是两个发展的领域,将机器学习应用于自然语言处理,已经推动了人工智能领域的巨大进步,例如,机器翻译系统如Google Translate,语音助手如Apple的Siri。机器学习和自然语言处理的不断演进将继续塑造未来的科技发展和改变我们与计算机互动的方式。

  课程目标

  本课程的目标是为学生提供必要的技能,以进行高质量的研究,并从数据中提取可操作的见解并进行预测。本课程将为学生提供使用Python编程语言进行应用机器学习的基础知识库。学生将在统计和概率框架内学习重要的数据整理,特征选择,模型选择和模型验证技术,重点是文本分析和自然语言处理。其目的不仅是让学生接触建模技术,而且还让学生通过他们在课堂和家庭作业练习中创建的模块来构建真正的工作系统。此外,学生将通过从广告技术、金融科技和营销技术数据集中提取见解并进行预测,接触数据科学家使用的各种常用工具。

  Course background

  Machine learning is a technique that allows computer systems to learn from data and improve performance. Natural language processing is the field that studies how computers understand and generate human natural language. Its goal is to enable computers to understand text and speech just like humans and to be able to interact with humans in natural language. The development of NLP has benefited from advances in machine learning and deep learning techniques that have enabled computers to better process and understand natural language. Machine learning and natural language processing are two fast-growing fields, and applying machine learning to natural language processing has driven huge advances in artificial intelligence, for example, machine translation systems such as Google Translate, and voice assistants such as Apple's Siri. The constant evolution of machine learning and natural language processing will continue to shape future technological developments and change the way we interact with computers.

  Course objective

  The goal of this class is to arm students with the necessary skill-set to perform quality research and to extract actionable insights from data and make predictions. This course will provide students with a foundational knowledge base of applied machine learning using the Python programming language. Students will learn vital data wrangling, feature selection, model selection and model validation techniques within statistical and probabilistic frameworks with an emphasis on text analytics and natural language processing. The intent is to not only expose students to modeling techniques but also place students in the mind-set to build a real working system through modules they create during both in-classroom and homework exercises. In addition, students will gain exposure to a variety of common tools used by Data Scientists by extracting insights and making predictions from AdTech, FinTech and MarTech datasets.

  Suitable For

  适合人群

  对计算机科学,数据科学,机器学习,自然语言处理,商业分析,管理信息系统等专业感兴趣的学生。

  修读数学、计算机科学、信息科学等专业,以及未来希望在数据分析、商业分析、计算机科学等领域从业的学生。

  具备高等数学、统计学、概率论以及Python编程基础的学生。

  Professor Introduction

  导师介绍

Patrick Houlihan -哥伦比亚大学教授

  Patrick Houlihan

  哥伦比亚大学教授

  哥伦比亚大学数据科学教授

  阳狮传媒集团决策副总裁

  美国 B2B 客户数据平台CaliberMind数据科学家

  Quantheta的联合创始人

  超过14年半导体行业专业咨询经验

  主导咨询工程数额超过五亿美金

  拥有上百篇在软件系统设计和数据分析领域的论文

  研究方向 Research Interests

  Machine Learning 机器学习

  Natural Language Processing 自然语言处理

  Stochastic Processes 随机过程

  Computational Methods in Finance 金融计算方法

  Algorithmic Trading 算法交易

  Strategies, Portfolio Theory 策略,投资组合理论

  Course Syllabus

  课程大纲

  1. 摘要,数据整理,数据清洗,降维,归一化,填补缺失值

  2. 自然语言处理:文本分词、词性标注、词形还原、词干提取、特征矩阵

  3. 特征选择:TF-IDF、信息增益、互信息、特征向量、N-gram方法、文献综述

  4. 文本摘要:文本摘要和提取,主题建模和关键词提取

  5. 模型选择,网格搜索,验证和评估,性能指标

  1. Abstract, Data Wrangling, Cleaning Data, Dimension Reduction, Normalization, Imputations

  2. Natural Language Processing: Text Tokenization, Part of Speech Tagging, Lemmatization, Stemming, Feature Matrix

  3. Feature Selection: TF-IDF, Information Gain, Mutual Information, Feature, Vector, N-gram methods, Literature Review

  4. Text Summarization: Text Summarization and Extraction, Topical Modeling and key phrase extraction

  5. Model Selection, Grid Search, Validation and Evaluation, Performance Metrics

  Student Papers

  往期学员论文

  Modeling of User Profiles of Financial Products and Comparison of Purchase Prediction models: Based on Machine Learning

  金融产品用户档案建模与购买预测模型比较——基于机器学习

  Construction of Wine Quality Prediction Model based on Machine Learning Algorithm

  基于机器学习算法的葡萄酒品质预测模型的构建

  User Behavior Set: Medley of User Behaviors to Eliminate Data Spatio-Temporal Sparsity

  用户行为集:消除数据时空稀疏性的用户行为混合

  Program System

  项目设置

  Program Schedule

  课表详情

  课表尚未排出,稍后为您更新

  Learning Outcomes

  学习成果

  Other Information

  其他资料

  Patrick_Houlihan_CV.pdf

  Patrick_Houlihan_Syllabus.pdf

  相关论文.pdf

  录取案例.pdf

  论文常见问题.pdf

  课程日历.pdf

更多培训课程,学习资讯,课程优惠,课程开班,学校地址等学校信息,请进入 西安研课教育 详细了解 咨询电话:400-6863-912 你也可以留下你的联系方式,让课程老师跟你详细解答: 在线咨询

相关课程更多>>

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-6863-912