Machine Learning

Khóa học trang bị cho học viên lý thuyết sâu sắc về các vấn đề trong Học máy và ứng dụng. Thông qua các bài thực hành trực quan, học viên tự tay xây dựng, kiểm nghiệm một cách trực quan các thuật toán hoạt động và kết quả của chúng. Khóa học cũng cung cấp cho học viên khả năng làm việc chuyên nghiệp với các công cụ Machine Learning trong Python như Scikit Learn, đồng thời củng cố kĩ năng tiền xử lý dữ liệu đã được học trong khóa học Data Analysis để áp dụng trong bài toán Machine Learning. Qua khóa học, học viên được trang bị đầy đủ kiến thức – kĩ năng để tự tin làm việc trong các vị trí tương ứng.

Thời lượng

  • 40 giờ bài giảng
  • 80 giờ tự học

Mục tiêu khóa học

  • Hiểu Machine Learning là gì
  • Hiểu khái niệm cơ bản, nòng cốt của Machine Learning
  • Hiểu sự khác nhau giữa Classification, Clustering, Regression
  • Hiểu về Supervised Learning và Unsupervised Learning
  • Hiểu được các giải thuật ML cơ bản: Linear Model, MLP, NN, SVM,Tree-based
  • Biết các phương pháp xử lý dữ liệu, training model ML, tinh chỉnh siêu tham số cho mỗi loại model
  • Đánh giá được hiệu năng, cải tiến và lựa chọn mô hình
  • Xây dựng và huấn luyện các model ML sử dụng scikit-learn
  • Đánh giá hiệu quả của mô hình, cung cấp kĩ năng điều chỉnh, tối ưu mô hình

Kiến thức đạt được sau khóa học

  • Giới thiệu về Machine Learning và phân nhóm các thuật toán Machine Learning
  • Phân cụm (Clustering, Kmean, online Kmean)
  • Hồi quy tuyến tính (Linear regression)
  • Machine Learning framework: Scikit-learn
  • Láng giềng gần nhất (K-nearest neighbors)
  • Trích chọn đặc trưng và chuẩn hóa (Feature extraction and normalization)
  • Máy vector hỗ trợ (Support Vector Machine)
  • Validation, Overfitting và Regularization
  • Mạng nơ-ron (Neural Network)
  • Phân lớp với Naïve Bayes
  • Giảm chiều dữ liệu (Dimensionality reduction)
  • Decision Trees, Random forests và ensemble learning methods
  • Những ứng dụng của ML: Recommender Systems, Phân loại thư rác

Kĩ năng trọng điểm

  • Lý thuyết Machine Learning
  • Xây dựng mô hình với Sklearn Python
  • Kiểm thử, trực quan hóa hiệu quả mô hình
  • Tinh chỉnh, lựa chọn mô hình phù hợp

Công nghệ được sử dụng

  • Pandas
  • Matplotlib, Seaborn
  • Selenium
  • Jupyter Notebook
  • Scikit-learn Mode
  • Sklearn Pipeline
  • Sklearn data transform

Đối tượng học viên

  • Sinh viên trong và ngoài ngành IT muốn học về phân tích dữ liệu
  • Người đang làm việc trong lĩnh vực IT muốn mở rộng kĩ năng
  • Người làm việc với các tác vụ cần phân tích dữ liệu như: tài chính, ngân hàng, xã hội
  • Người muốn học sâu về Data Science