全国服务热线:400-6863-912

位置:深圳集思未来教育 > 计算机与人工智能> 深圳集思未来人工智能强化学习与推荐系统专题

深圳集思未来人工智能强化学习与推荐系统专题

深圳集思未来人工智能强化学习与推荐系统专题

  • 开班时间:滚动开班
  • 课程价格:电话咨询
  • 培训周期:电话咨询
  • 上课地点:深圳市福田...发送地址到手机上
在线咨询 预约报名

课程介绍

人工智能 强化学习与推荐系统专题: 随机过程、强化学习前沿AI算法在Tik Tok智能推荐内容等推荐系统中的应用 【大学组】


课时安排: 7周在线小组科研学习+5周不限 时论文指导学习

适合人群 | Prerequisites

适合年级(Grade): 大学生及以上
适合专业(Major): 人工智能、数据科学、统计学等专业学生;(学生需要具备微积分、概率论与数理统计基础,同时会使用Python编程语言

导师介绍 | Instructor Introduction

  Osman——卡内基梅隆大学(CMU)终身正教授  

  Osman导师现任是卡内基梅隆大学(CMU)计算机科学学院的终身正教授。此前他是CMU CyLab的博士后研究员。2011年秋季,他还在亚利桑那州立大学担任访问博士后学者。导师于2011年获得马里兰大学(University of Maryland at College Park,MD)的电气和计算机工程博士学位。导师的研究重点是计算系统的建模、分析和性能优化,并使用应用概率、网络科学、数据科学和机器学习的工具。在数据科学和机器学习的背景下,他正在研究使用顺序样本(例如,多臂机器人)的统计推断和决策,以及弹性分布式机器学习。在网络科学方面,他有广泛的兴趣,包括网络物理系统的健壮性,重点关注关键基础设施系统;安全可靠的大规模自组织网络设计,日益关注物联网的新兴应用;以及复杂网络中的传染过程,重点关注病毒、(错误)信息和意见传播的建模、分析和控制。导师是IEEE的成员,CIT院长早期职业奖学金获得者,IBM学术奖获得者,以及ICC 2021和IPSN 2022的较佳论文奖获得者。
  Osman is a Full Research Professor of Electrical and Computer Engineering(ECE)at Carnegie Mellon University(CMU).Prior to joining the faculty of the ECE department in August 2013,he was a Postdoctoral Research Fellow in CyLab at CMU.He has also held a visiting Postdoctoral Scholar position at Arizona State University during Fall 2011.Dr.Yağan received his Ph.D.degree in Electrical and Computer Engineering from the University of Maryland at College Park,MD in 2011,and his B.S.degree in Electrical and Electronics Engineering from the Middle East Technical University,Ankara(Turkey)in 2007.
  Dr.Yağan's research focuses on modeling,analysis,and performance optimization of computing systems,and uses tools from applied probability,network science,data science,and machine learning.In the context of data science and ML,he is working on statistical inference and decision making using sequential samples(e.g.,multi-armed bandits),and resilient distributed machine learning.On the network science side,he has broad interests including robustness of cyber-physical systems with emphasis on critical infrastructure systems;secure and reliable design of large-scale ad-hoc networks with an increasing focus on emerging applications of Internet of Things;and contagion processes in complex networks with a focus on modeling,analysis,and control of spread of viruses,(mis)information,and opinions.
  Dr.Yağan is a senior member of IEEE,and a recipient of a CIT Dean's Early Career Fellowship,an IBM Academic Award,and best paper awards in ICC 2021 and IPSN 2022.
  任职学校
  卡内基梅隆大学(CMU)始建于1900年,是世界范围内颇负盛名的私立研究型大学,拥有世界历史较悠久的计算机学院之一,位列CSRankings排名世界,U.S.News计算机本科及硕士项目与斯坦福大学,麻省理工学院,加州大学伯克利分校并列全美。“截至2019年3月,学校的教员和校友中共有20人获得诺贝尔奖,13人获得图灵奖,22人获评美国艺术与科学院院士,19人进入美国科学促进会,72人入选美国学院。卡内基梅隆大学是美国计算机名校之一,连续多年计算机专业排名。

项目背景 | Program Background

  一个面前有N个机,事先他不知道每台机的真实盈利情况,他应该如何根据机器的操作结果做出反应,来使自身的收益较大化呢?——这个假设便是的“多臂强盗”问题的名字来源。实际上在机器学习被应用的领域当中,时时刻刻也都存在着这样的选择与决策情景:一个品牌针对其商品有着多款广告宣传,但不知道每一个用户对于每一种广告的接受程度;在投资中我们可能会面临多个项目,但并无法确认每个项目的具体回报率;亦或是在线零售商如何在不完全了解需求信息的背景下进行实时动态定价……

项目介绍 | Program Description

  “多臂强盗”问题是概率论中的一个经典问题,亦是深度强化学习中的重要模块。人们针对解决此类不确定性序列决策问题,提出了“多臂强盗”算法框架(Multi-Armed Bandits,简称MAB,中文又译作“多臂”)。近年来这一算法框架因优异的性能和较少的反馈学习等优点,在推荐系统、信息检索到医疗保健和金融投资等诸多应用领域中受到了广泛关注。本课题正是以此框架为核心内容,学生将在参与的过程中深入了解算法的基础模型及应用,将认识到被广泛使用的上置信界算法(Upper Confidence Bound,简称UCB)及汤普森采样算法(Thompson Sampling Algorithms)。导师还将讲授自身在该领域的较新研究成果。
  This is an introductory course on multi-armed bandits,which provides a sequential decision-making framework under uncertainty and has broad applications in recommendation systems,dynamic pricing,clinical trials,financial investments,etc.We will cover the classical multi-armed bandit model and its applications,several widely used algorithms proposed for its solution including the Explore-Then-Commit(ETC),Upper Confidence Bound(UCB)and Thompson Sampling(TS)Algorithms,performance analysis of these algorithms,and conclude the lectures with the recent work of the instructor on correlated and structured bandits.

项目大纲 | Syllabus


  ●○ 多臂问题的基础介绍  Introduction to Multi-armed Bandits
  ●○ 随机多臂模型  Stochastic Multi-armed Bandits
  ●○ 上置信界(UCB)算法  The Upper Confidence Bound(UCB)Algorithm
  ●○ 贝叶斯强盗策略与汤普森采样算法  Bayesian Bandits and Thompson Sampling(TS)
  ●○ 算法应用于实施,算法性能分析  Algorithm implementation,performance analysis
  ●○ 多臂算法在推荐系统中的应用  Applications of Bandits in Recommendation Systems
  ●○ 学术研讨1:教授与各组学生探讨并评估个性化研究课题可行性,帮助学生明晰后续科研思路Final Project Preparation Session I
  ●○ 学术研讨2:学生将在本周课前完成程序设计原型(prototype)及伪代码(Pseudocode),教授将根据各组进度进行个性化指导,确保学生优质的终期课题产出Final Project Preparation Session II
  ●○ 项目成果展示  Final Presentation
  ●○ 论文指导  Project Deliverables Tutoring

项目收获Program Outcome

017周在线小组科研学习+5周不限 时论文指导学习 共125课时
02项目报告
03优 秀学员获主导师Reference Letter
04EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)
05结业证书
06成绩单

更多培训课程,学习资讯,课程优惠,课程开班,学校地址等学校信息,请进入 深圳集思未来教育 详细了解 咨询电话:400-6863-912 你也可以留下你的联系方式,让课程老师跟你详细解答: 在线咨询

相关课程更多>>

温馨提示:提交留言后老师会第一时间与您联系!热线电话:400-6863-912