KHOA HỌC DỮ LIỆU ỨNG DỤNG (DATA SCIENCE)

4114794f84ec70b229fd
93bde0acefcd189341dc
dcdfdce1a29b55c50c8a
7a11896a3169c6379f78
previous arrow
next arrow

Lộ trình Python – Data Science giúp các bạn làm chủ các kĩ năng quan trọng của một chuyên viên phân tích – mô hình hóa dữ liệu. Lộ trình học bao gồm các chủ đề thiết yếu với một chuyên viên phân tích – mô hình hóa dữ liệu như: phân tích thống kê dữ liệu với Pandas; Trực quan hóa dữ liệu với Matplotlib – Seaborn; lọc nhiễu, xử lý missing data; tổng hợp dữ liệu; thu thập dữ liệu sử dụng Selenium, mô hình hóa dữ liệu với các thuật toán Machine Learning. Không chỉ dừng lại tại đó, lộ trình học còn cung cấp cho học viên các kiến thức nền tảng về Deep Learning để ứng dụng vào các bài toán khó như Thị giác máy tính, Xử lý ngôn ngữ tự nhiên,… Với các mentor kinh nghiệm từ các công ty, lộ trình học hướng tới các kĩ năng phục vụ công việc, lý thuyết dễ hiểu, không quá hàn lâm nhưng phải đầy đủ và chắc chắn.

Tại sao bạn nên học lộ trình này

Mục tiêu lộ trình

Lộ trình học

Data Analysis

Data Analysis

 

Khóa học cung cấp cho học viên khả năng ứng dụng Python cùng các công cụ, thư viện, nền tảng để có cái nhìn sâu sắc về dữ liệu, tìm các 'mỏ vàng' về xu hướng, dự báo từ dữ liệu. Khóa học bao gồm các bài giảng, ví dụ nhằm củng cố kiến thức, kĩ năng thực hành cho học viên cũng như có các bài tập, bài lab để học viên tự do phát triển năng lực sáng tạo. Được thiết kế để cung cấp không chỉ kiến thức, kĩ năng sử dụng các công cụ thu thập, phân tích thống kê và trực quan hóa dữ liệu, khóa học còn rèn luyện khả năng tư duy, phương pháp kể chuyện qua dữ liệu dể học viên có thể phát triển sự nghiệp của mình trong các lĩnh vực có sử dụng đến phân tích dữ liệu, không chỉ riêng công nghệ thông tin. Sau khóa học, học viên có thể tự tin ứng dụng các kiến thức được học với các tác vụ của một chuyên viên phân tích dữ liệu.

 

Xem thông tin chi tiết khóa học tại đây

 

Thời lượng

  • 30 giờ bài giảng
  • 60 giờ tự học

 

Kĩ năng - kiến thức trọng điểm

  • Thống kê - phân tích dữ liệu
  • Trực quan hóa dữ liệu
  • Kể chuyện qua dữ liệu
  • Thu thập dữ liệu

 

Công nghệ đặc biệt

  • Pandas
  • Matplotlib, Seaborn
  • Selenium
  • Jupyter Notebook

Machine Learning

Machine Learning

 

Khóa học trang bị cho học viên lý thuyết sâu sắc về các vấn đề trong Học máy và ứng dụng. Thông qua các bài thực hành trực quan, học viên tự tay xây dựng, kiểm nghiệm một cách trực quan các thuật toán hoạt động và kết quả của chúng. Khóa học cũng cung cấp cho học viên khả năng làm việc chuyên nghiệp với các công cụ Machine Learning trong Python như Scikit Learn, đồng thời củng cố kĩ năng tiền xử lý dữ liệu đã được học trong khóa học Data Analysis để áp dụng trong bài toán Machine Learning. Qua khóa học, học viên được trang bị đầy đủ kiến thức - kĩ năng để tự tin làm việc trong các vị trí tương ứng.

 

Xem thông tin chi tiết khóa học tại đây

 

Thời lượng

  • 40 giờ bài giảng
  • 60 giờ tự học

 

Kĩ năng - kiến thức trọng điểm

  • Lý thuyết Machine Learning
  • Xây dựng mô hình với Sklearn Python
  • Kiểm thử, trực quan hóa hiệu quả mô hình
  • Tinh chỉnh, lựa chọn mô hình phù hợp

 

Công nghệ đặc biệt

  • Scikit-learn Model
  • Sklearn Pipeline
  • Sklearn data transform

Deep Learning

Deep Learning

 

Khóa học cung cấp cho học viên góc nhìn sâu sắc về lý thuyết và ứng dụng của Deep Learning hiện đại. Thông qua các bài giảng và thực hành, học viên không chỉ tiếp thu kiến thức lý thuyết sinh động về Deep Learning mà còn được thực hành ứng dụng trực tiếp trên dữ liệu. Khóa học cũng giúp các học viên làm chủ các kĩ năng xây dựng mô hình Deep Learning cũng như tinh chỉnh, tối ưu mô hình với các thư viện, framework hiện đại như Tensorflow. Kết thúc khóa học, học viên có thể tự tin ứng dụng trong các dự án doanh nghiệp, cá nhân hoặc vững bước tìm tòi, học tập sâu hơn về ứng dụng AI trong các lĩnh vực như Thị giác máy tính, Xử lý ngôn ngữ tự nhiên.

 

Xem thông tin chi tiết khóa học tại đây

 

Thời lượng

  • 30 giờ bài giảng
  • 60 giờ tự học

 

Kĩ năng - kiến thức trọng điểm

  • Hiểu sâu về Deep Learning
  • Nắm vũng các kiến trúc mạng cơ bản
  • Hiểu rõ các kiến trúc mạng tiên tiến
  • Làm chủ kĩ năng tinh chỉnh siêu tham số - hiệu năng model

 

Công nghệ đặc biệt

  • Tensorflow
  • CNN
  • RNN - LSTM
  • Similarity - based method
  • Attention Model

Kết quả sau lộ trình

Chuyên môn

  • Hiểu rõ các chủ đề lý thuyết quan trọng của Machine Learning – Deep Learning
  • Nắm vững cách sử dụng các công cụ trong hệ sinh thái Python để Phân tích – Mô hình hóa dữ liệu
  • Biết cách lập trình trình thu thập dữ liệu

Kĩ năng

  • Xây dựng thành thạo pipeline phân tích – mô hình hóa dữ liệu
  • Xây dựng tốt trình thu thập dữ liệu với Selenium
  • Có khả năng sử dụng các công cụ để phân tích thống kê, trực quan hóa dữ liệu
  • Làm chủ các thư viện Machine Learning, Deep Learning như Sklearn – Pytorch để xây dựng Model
  • Nắm vững kĩ năng tối ưu hóa hiệu năng model
  • Sử dụng các công cụ như Jupyter Notebook, Google Colab

Cơ hội việc làm

  • Cơ hội tiếp cận với các nhà tuyển dụng
  • Rèn luyện khả năng viết CV – phỏng vấn
  • Được viết thư giới thiệu

Phương pháp giảng dạy

Giảng dạy tinh gọn

Tư duy sáng tạo

Thực hành là trên hết

Đối tượng học viên

  • Sinh viên trong và ngoài khối ngành CNTT
  • Lập trình viên đã và đang sử dụng ngôn ngữ và nền tảng khác muốn mở rộng kĩ năng
  • Người muốn chuyển ngành

Câu hỏi thường gặp

Khóa học của Data Science tại Turing School có gì đặc biệt?

Phương châm của chúng tôi là giảng dạy tinh gọn, chú trọng thực hành để phát triển tư duy sáng tạo, mỗi buổi học đều có rất nhiều ví dụ, bài tập để học viên thực hành. Chúng tôi mong muốn học viên không chỉ có kiến thức mà còn có kĩ năng, hơn nữa có khả năng tìm tòi, tư duy giải quyết vấn đề. Với việc lấy học viên làm trọng tâm, các buổi học sẽ là các buổi trao đổi kiến thức, kinh nghiệm, thực hành với ví dụ và bài tập. Do đó, cùng một nội dung, chương trình của Turing School dài hơn do tập trung nhiều hơn vào tính thực hành.

Tôi nên học Data Analysis với Excel, PowerBI (hoặc Tableau) hay với Hệ sinh thái Python?

Excel, PowerBI là các công cụ giao diện dễ sử dụng do Microsoft phát triển. Hệ sinh thái Python với các thư viện như Numpy, Pandas, Matplotlib, Seaborn, Scikit-learn, Keras, Pytorch đều là các thư viện mã nguồn mở, được cộng đồng hỗ trơ. Do vậy chi phí cũng là một điều cần cân nhắc, các gói của Excel, PowerBI khá tốn kém. Với cá nhân, chi phí đó có thể không quá nhiều, tuy vậy với các doanh nghiệp, chi phí cho nhiều người sử dụng các công cụ trả phí là rất lớn. Trong thực tế, các doanh nghiệp thường chuộng các công cụ nguồn mở, miễn phí hơn. Do đó, các vị trí tuyển dụng cũng nhiều hơn với các công cụ này. Hơn nữa, Excel, PowerBI là các công cụ kéo thả, có giao diện, trong khi các công cụ của hệ sinh thái Python là các công cụ cần khá nhiều code. Điều đó vừa là điểm tốt khi chúng ta hiểu sâu vè công cụ, vấn đề nhưng cũng là thách thức khi chúng ta phải nắm rõ cách lập trình Python và sử dụng các công cụ đó.

Tôi nên học khóa Deep Learning hay Applied DL in Computer Vision/NLP?

Khóa học Deep Learning nằm trong lộ trình Data Science trong khi khóa học còn lại nằm trong lộ trình Ứng dụng Trí tuệ nhân tạo, tương ứng với lĩnh vực Thị giác máy tính và Xử lý ngôn ngữ tự nhiên. Khóa học Deep Learning cung cấp nền tảng để bạn biết các kiến thức, tư duy về Deep Learning trong khi khóa học sau sử dụng các nền tảng đó để xây dựng các ứng dụng nâng cao giải quyết các vấn đề khó và thú vị trong các lĩnh vực tương ứng. Như vậy, nếu bạn chưa có kiến thức hoặc chưa tự tin với Deep Learning, bạn nên học khóa học này, còn nếu bạn đã tự tin rồi, bạn có thể chuyển đến học các khóa học ứng dụng.

Tại sao tôi cần phải học thu thập dữ liệu ?

Dữ liệu là mỏ vàng trong thời đại công nghệ số 4.0, các doanh nghiệp luôn khao khát có nguồn dữ liệu dồi dào để tìm kiếm khách hàng cũng như phân tích xu hướng thị trường. Nhưng nguồn dữ liệu lớn, có giá trị không nằm trong tay đa số các đơn vị cần, mà tập trung vào các công ty lớn như Amazon, Google, Facebook, Netflix,... hay như ở Việt Nam có các công ty như Shopee, Lazada, Tiki, Cốc Cốc, VNG, VCCorp. Do vậy, nếu chúng ta cần có những bộ dữ liệu tốt để phát triển các mô hình, kĩ năng phân tích dữ liệu là không thể thiếu được.

Tôi nên học Thu thập dữ liệu Web với Scrapy hay Selenium?

Thu thập dữ liệu là một lĩnh vực thú vị và rất thử thách. Các trang web thường được trang bị rất nhiều lớp bảo về chống thu thập dữ liệu. Để đơn giản, chúng ta có thể sử dụng các thư viện tạo HTTP Request và Parse Response là có thể thu thập dữ liệu được. Tuy vậy, đối mặt với các trang web xử lý giao diện hiện đại với Javascript, cách này thường không thực hiện được. Chúng ta cần sử dụng một công cụ Web Automation như Selenium để thực hiện. Mặt trái của công cụ Selenium là chậm, nặng, đòi hỏi máy có cấu hình lớn, đắt tiền. Khóa học Thu thập dữ liệu với Scrapy là khóa học thu thập dữ liệu nâng cao, sử dụng HTTP Request thuần túy, vượt qua các chướng ngại như trang web xử lý Javascript, bảo mật cơ bản, tập trung vào thu thập dữ liệu hiệu năng cao. Phần học thu thập dữ liệu với Selenium trong khóa Data Analysis, ngược lại, tập trung vào khả năng thu thập dữ liệu để phục vụ việc phân tích dữ liệu - mô hình hóa dữ liệu. Trong tác vụ này, chúng ta lại tập trung vào việc có thể thu thập dữ liệu được để làm tác vụ khác chứ không phải là xây dựng trình thu thập dữ liệu hiệu năng cao. Do vậy, nếu bạn cần xây dựng, tối ưu hóa chuyên một tác vụ thu thập dữ liệu hiệu năng cao, các bạn nên học khóa học Scrapy, nếu bạn muốn tập trung vào việc xây dựng mô hình - phân tích dữ liệu, các bạn nên học thu thập dữ liệu Selenium