Skip to content

Course Syllabus

课程:数学2080

Division:自然科学与数学
Department: Mathematics
Title:应用数据科学

学期批准: Fall 2020
五年制复习学期: Fall 2025
End Semester: Spring 2026

目录描述学生将获得Python编程入门, 数据分析工具, 以及必要的统计数据, clean, analyze, explore, 并使用真实的数据集可视化数据. Using statistics, 学生将学习数据驱动推理和决策, 并有效地传达这些结果. 本课程是为非工程和科学专业的学生设计的. 工程或科学专业的学生应该选择数学3080.

Semesters Offered:
信贷/时间要求: Credit: 2; Lecture: 2; Lab: 0

Prerequisites数学2040 C或以上,数学1100 C或以上.

Justification数据收集和数据分析无处不在,并迅速成为企业经济成功的先决条件. 本课程提供了利用数据进行预测所需工具的一个子集. 本课程将通过提供相关的数学课程来支持软件工程学士学位.


学生学习成果:
学生将通过自抓取和数据api获取数据.  学生将通过作业进行评估, quizzes, 考试和/或课堂讨论-导师将提供反馈.

学生将清理和重塑杂乱的数据集. 学生将通过作业进行评估, quizzes, 考试和/或课堂讨论, 项目指导员将提供反馈.

学生将学习使用统计软件来部署统计方法,包括广义线性回归, cluster analysis, 和分类. 学生将通过作业进行评估, class projects, quizzes, 考试和/或课堂讨论-导师将提供反馈.

学生将应用降维和进行网络数据的基本分析.  学生将通过作业进行评估, quizzes, 考试和/或课堂讨论-导师将提供反馈.

学生将评估结果, 根据数据做决定, 并有效地传达这些结果. 学生将通过作业进行评估, class projects, quizzes, 考试和课堂讨论-导师将提供反馈.


Content:
本课程将介绍Python中的数据分析工具, 描述性统计, 数据结构与Numpy & 熊猫,假设检验入门 & 统计推断, 通过api进行网页抓取和数据采集, 广义线性回归, classification methods including logistic regression; k-nearest neighbors; decision trees; support vector machines; and neural networks, 数据可视化, 聚类方法, dimensionality reduction; including principle component analysis; network analysis; rating, ranking, and elections, cleaning and reformatting messy datasets using regular expression or dedicated tools such as open refine; natural language processing; ethics of big data.

本课程支持一个包容的学习环境,让不同的观点得到认可, 受人尊敬并被视为力量之源. 使用真实数据考虑各种各样的问题将有助于实现这一目标.

主要业绩指标:
学生的学习将通过以下方式进行评估:

出席/参与0 - 15%

班级小组活动10% - 15%

计算机项目20% - 50%

Quizzes 0 to 20%

Homework 5 to 25%

期中考试/测验占20%到40%

期末考试15%到35%


代表性文本和/或用品:
McKinney, W. (当前版本). 用于数据分析的Python:使用pandas、NumPy和IPython进行数据争用. 塞瓦斯托波尔,加利福尼亚州:O'Reilly Media.

Géron, A. (当前版本). 动手机器学习与Scikit-Learn和TensorFlow:概念, tools, 以及建立智能系统的技术. Beijing; Boston; Farnham; Sebastopol; Tokyo: O'Reilly.

本课程需要电脑和统计软件. 推荐使用Python或R等免费软件,但订阅软件(例如.g.如SAS、SPSS),可由讲师自行决定是否使用.


教育学声明:
约翰·杜威说:“教育不应该围绕着获得一套预先确定的技能。, 而是实现一个人的全部潜力,并利用这些技能为更大的利益服务的能力.将这一理念运用到这门课的教学中, 老师将帮助学生在现代课程中学习理论和应用. 在课程结束时, 学生应该知道如何使用技术来应用特定的技能,并分析他们的工作结果.

本课程支持一个包容的学习环境,让不同的观点得到认可, 受人尊敬并被视为力量之源. 该环境由考虑来自不同来源的数据的活动提供支持. Moreover, 学生将在小组中进行互动,并鼓励他们在面对可能与自己的信念不一致的数据时进行批判性思考.

教学手段:
Lecture

Hybrid

最大班级人数: 25
最佳班级规模: 20