深度学习具备强感知能力但缺乏一定的决策能力,强化学习具备决策能力但对感知问题束手无策,因此将两者结合起来可以达到优势互补的效果,为复杂系统的感知决策问题提供了解决思路。

今天我们推荐这样一门课程——UC Berkeley的 CS188《人工智能导论》(Introduction to Artificial Intelligence)。课程主要介绍了AI的基础知识,尤其是强化学习方面,讲解非常详细,覆盖面比较全面,学习资料也很丰富,包括了课程的全套视频、课件PPT、课后学习资料、Homework、配套的Project,该视频全部内容已经由 矩池云 进行翻译,对AI新手来说非常友好。

课程全套视频

课程介绍

根据官方介绍,"该课程介绍了智能计算机系统设计的基本思想和技术,具体侧重于统计和决策理论建模方法的相关内容。"

话题涉及搜索,博弈树(Game Trees),马尔可夫决策过程(MDP),强化学习,决策理论,概率问题、独立性和推理等人工智能科学基础知识。

  • 不知情搜索:深度优先搜索、宽度优先搜索、统一成本搜索
  • 知情搜索:贪婪搜索、A*搜索、启发式+最优搜索
  • 对抗搜索:极大极小值搜索、α-β剪枝、Expectimax
  • 决策理论:最大期望效益
  • 马尔可夫决策过程:贝尔曼方程、值迭代
  • 强化学习:Q-learning、利用与探索策略
  • 贝叶斯网络:独立性、推理、采样
  • 机器学习:感知机、朴素贝叶斯网络、神经网络、集群

学习完该课程后,你会 学会自己构建自动的agent,它可以在完全知情/部分可观察/对抗环境中有效做出决策。你的AI agent会在不确定的环境中进行推理,根据奖励结构自行优化行为。你会学会设计机器学习算法,用于识别手写数字以及进行图像分类。在本课程中学习的技术及方法适用于各类人工智能问题,可以为你日后进一步研究深造的方向奠定一定的基础。

课件插图大多为卡通形式,你会经常看到课件上在玩《吃豆人》游戏或者其他游戏获得的收益最大。随着课程的深入,难度也会加大。对于基于python的编程练习,主要是用《吃豆人》游戏作为教学辅助,课程实操部分构建了一个吃豆人游戏框架,让学生实施可插拔的搜索策略。虽然部分学生反馈课程有一定难度,但这门课程仍被广泛认为是目前提供AI相关技术基础较为值得观看的MOOC课程之一。

课程主讲老师

该课程早期由Pieter Abbeel和Dan Klein讲授。

Pieter Abbeel师从机器学习大牛吴恩达,是机器人学专家、UC伯克利计算机科学与电气工程教授。他的深度强化学习和深度无监督学习教材是AI研究者的经典学习资料,包括CS294-158(Deep Unsupervised Learning)、CS188(Introduction to Artificial Intelligence)、CS287(Advanced Robotics)等。

Dan Klein,伯克利大学自然语言处理小组负责人。2004 年在斯坦福大学取得计算机科学的博士学位。主要研究重点是自然语言信息的自组织,兴趣领域包括无监督的语言学习、机器翻译、NLP 的高效算法、信息提取、语言丰富的语言模型、NLP 的符号和统计方法的集成以及历史语言学等。

基于两位教授多年的教学实践和课件资料,2020年的cs188夏季课程由Dan Klein教授的博士生Nikita Kitaev教授。最近,Nikita Kitaev的增量句法表示研究(Learned Incremental Representations for Parsing)获得了ACL2022的最佳论文(Best Paper)。

传送门

全文链接
视频直达
课程全套PPT、作业及配套Project

内容来源于网络如有侵权请私信删除

文章来源: 博客园

原文链接: https://www.cnblogs.com/matpool/p/16396151.html

你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!