在任何专业领域完成第二年学习的新生都被鼓励遵循以下提供的3+2加速课程, 如果他们有兴趣在五年内完成本科和研究生课程. 对该选项感兴趣的学生只有在进入新博网页本科课程并表现出良好的学习成绩后才有资格. 这些申请人必须满足以下最低条件,才能通过3+2途径入学:

  • 完成2年学业,各项学术事业考核合格.
  • 完成前提课程(见下文)
  • 由一名教师推荐参加3+2课程

必备的课程

以下课程必须在本科学习的前两年完成:

  • 数学2400 -微积分1
  • 数学3250 -微积分II
  • CSCI 2200 - Python编程入门
  • CSCI 3250 -中级Python或CSCI 2400 -面向对象编程
  • 数学2200 -概率1 (Mod 1)
  • 数学4550 -概率2 (Mod 2)
  • 数学2320 -线性代数

这些课程也可以用来满足 国际数据公司(IDC) 5100 研究生项目的数据科学入门训练营课程.

IDC 5204 -应用统计学I:一门统计学课程,侧重于描述和推断统计, 以线性回归为主题, 置信区间和假设检验, 包括概率论和重采样等现代方法, 使用R中说明的所有方法,并重点关注使用工业数据集的数据科学相关方法.

IDC 5110 -数据改造和探索性数据分析:重塑的实用方法课程, 重组, 并通过探索性分析总结数据中的关系. 预处理的原理和方法, 正常化, 包括验证数据, 重点是合作和可重复的研究.

IDC 5120 -数据科学算法:算法和性能度量的基础. Python教学, 本课程包括对排序和检索数据的有效算法的探索, 图算法和组合优化, 动态规划, 随机算法和近似算法.

数据科学数据库:传统数据库设计和管理的基础知识. 各种数据库的类型和比较,包括SQL数据库(如. Postgre, SQLite), NoSQL数据库,面向列的数据库(例如. HBase)和面向文档的数据库(例如. MongoDb). 数据检索和存储的一致性、可用性、可扩展性、效率和性能.

IDC 5296 -工业研讨会系列I:第一次提供了一个长达三个学期的研讨会系列,邀请来自各种工业领域的专业人士和高管作为嘉宾演讲. 每周或每两周的研讨会通过各种数据科学技术的应用,涵盖主题和商业中各种问题的应用.

IDC 5295 -工业研讨会:本课程提供的内容模块是对应用数据科学研究生课程常规课程的补充. 例子包括, 但不限于, 例如道德, 数据科学中的新兴或趋势技术, 特定领域的应用, 工业软件平台或工具, 并且专业的认证模块和考试在业界得到广泛认可.

IDC 5205 -应用统计学II:统计建模课程, 包括多元线性回归和逻辑回归, 更广泛地说, 广义线性模型. 重点放在模型的制定上, 建筑, 假设, 解释, 预测和评估, 并在R语言中实施,重点关注使用工业数据集的数据科学相关方法和模型.

IDC 5112 -数据可视化:一个以项目为中心的介绍,用于知识发现和结果交流的定量信息的可视化显示. 培养学生, 在这学期的课程中, 他们感兴趣的可视化应用程序,其中包含从工业应用程序或项目中收集的数据.

IDC 5210 -应用机器学习:基于项目的课程,涵盖监督和无监督学习,重点是处理真实的工业数据. 贝叶斯分析和其他具体的学习范例,包括回归, 聚类, 随机森林, 支持向量机, 内核的方法, 神经网络.

分布式计算:关于设计和维护大规模并行数据集的基础知识. 非关系数据库及其管理. 并行架构算法和相关软件工具,包括MapReduce/Hadoop框架和BigTable.

IDC 5297 -工业研讨会系列II:为期三个学期的研讨会系列的第二个产品,主持来自各种工业领域的专业人士和高管作为嘉宾演讲. 每周或每两周的研讨会通过各种数据科学技术的应用,涵盖主题和商业中各种问题的应用.

IDC 6293 -工业实习I:作为暑期实习或期中应用项目, 本课程是为希望将数据科学知识和技能付诸实践的学生提供的第一个广泛的真实行业经验机会. 必须与项目的工业合作伙伴或学生选择合作的公司/组织一起完成, 在数据科学学院的监督下.

IDC 6200 -高级应用统计:第二个统计建模课程, 与主题的混合,如广义加性模型, 纵向响应模型, 时间序列模型, 生存分析, 统计学习或贝叶斯统计, 重点关注与数据科学相关的模型. 以项目为重点,在应用业务环境中使用实际工业数据进行教学.

IDC 6215 -高级应用计算:计算的高级主题, 包括图像处理和目标检测等主题, 文本挖掘, 自然语言处理, 循环神经网络, 强化学习. 以项目为重点,在应用业务环境中使用实际工业数据进行教学.

IDC 6250 -实用数据科学:数据分析和数据科学管道的创建,并为行业交付. 在小组中工作, 学生从探索性分析开始分析行业提交的数据集, 其次是基于统计或机器学习的模型构建, 以及向行业合作伙伴构建和展示数据产品.

IDC 6298 -工业研讨会系列III:第三个也是最后一个长达三个学期的研讨会系列,主办专业人士和高管作为嘉宾演讲来自各种工业领域. 每周或每两周的研讨会通过各种数据科学技术的应用,涵盖主题和商业中各种问题的应用.

IDC 6294 -工业实习II:作为数据科学团队的一部分,在工业中工作一整个学期, 同时每周接受数据科学学院的监督并向其提交报告. 这是工业实习的第二阶段,也是最后阶段,学生在工业合作伙伴公司或组织或自己选择的公司工作. 业绩由指导老师和公司主管共同评估.