Có nhiều loại biểu đồ có sẵn, mỗi loại có điểm mạnh và trường hợp sử dụng riêng. Một trong những phần khó nhất của quá trình phân tích là chọn đúng cách để thể hiện dữ liệu của bạn bằng một trong những cách thể hiện trực quan dữ liệu. Trong bài viết này hocthue.net sẽ giới thiệu cách sử dụng, lựa chọn biểu đồ cho phù hợp với từng bối cảnh.
Trong bài viết này, chúng ta sẽ sử dụng biểu đồ, đồ thị phục vụ mục đích trực quan hóa dữ liệu dựa trên loại dữ liệu thông thường trong luận văn thạc sĩ mà bạn đang thực hiện. Không những vậy, sử dụng các biểu đồ là điều cơ bản trong khoa học dữ liệu với vai trò trực quan hóa dữ liệu (data visualization).
Trực quan hóa giúp truyền đạt insights một cách rõ ràng và thuyết phục cho mọi đối tượng. Kỹ năng này đòi hỏi hiểu biết về thiết kế, tâm lý học nhận thức và khả năng sử dụng các công cụ trực quan hóa chuyên dụng.
- Thể hiện dữ liệu thay đổi theo thời gian:
- Thể hiện dữ liệu dạng "từng phần-với- toàn bộ"
- Thể hiệncách dữ liệu được phân phối
- So sánh giá trị giữa các nhóm
- Quan sát mối quan hệ giữa các biến
Các loại biến bạn đang phân tích và đối tượng xem trực quan cũng có thể ảnh hưởng đến biểu đồ nào sẽ hoạt động tốt nhất trong từng vai trò. Một số hình ảnh trực quan nhất định cũng có thể được sử dụng cho nhiều mục đích tùy thuộc vào các yếu tố này. Dưới ngôn ngữ phân tích dữ liệu hay khoa học dữ liệu thì sử dụng biểu đồ là trực quan hóa dữ liệu.
Biểu đồ thể hiện sự thay đổi theo thời gian
Biểu đồ thể hiện sự thay đổi thời gian là xem sự thay đổi giá trị của một biến theo thời gian. Các biểu đồ này thường có thời gian trên trục hoành, di chuyển từ trái sang phải, với các biến giá trị quan tâm trên trục tung. Ví dụ, dữ liệu doanh thu của hocthue.net từ 2022, 2023 và 2024 nên được biểu hiện sự thay đổi theo thời gian.
Biểu đồ thanh (bar chart)
Biểu đồ đường (line chart) .
Thể hiện dữ liệu dạng "từng phần-với-toàn bộ"
Biểu đồ thể hiện thành phần so với tổng thành phần thể hiện tỷ lệ, số lượng các thành phần tạo nên tổng toàn phần (100%) đó . Ví dụ, bạn cần thể hiện tỷ lệ Nam (40%) và Nữ (60%) trong toàn bộ mẫu nghiên cứu (100%).
- Biểu đồ hình tròn (hay còn gọi biểu đồ bánh rán) thể hiện tổng thể bằng một vòng tròn, được chia thành các phần thành các phần.
Trong biểu đồ trên thể hiện cơ cấu chi phí cố định chiếm 20%, cơ cấu nhân sự chiếm 70% và chi phí marketing 10% của trong các loại chi phí của hocthue.net
- Biểu đồ thanh xếp chồng sửa đổi biểu đồ thanh bằng cách chia mỗi thanh thành nhiều thanh phụ, hiển thị bố cục từ một phần đến toàn bộ trong mỗi thanh chính.
Biểu đồ thể hiện thay đổi thành phần theo thời gian thì sử dụng biểu đồ diện tích.
-
Biểu đồ diện tích ở trên thể hiện biến đổi thành phần theo thời gian từ tháng 6/2024 đến 9/2024.
Biểu đồ thể hiện phân phối
Biểu đồ này thể hiện cách phân phối giá trị của điểm dữ liệu, ví dụ như bảng phân phối tần suất chúng ta thường được học trong xác suất thống kê hay biểu đồ Histogram. Từ biểu đồ này ta có thể nhận xét được hình dáng dữ liệu, tỷ lệ phân bố, độ lệch..
- Biểu đồ Histogram hoặc biểu đồ thanh (bar chart) là những loại biểu đồ có thể được sử dụng để hiển thị sự phân bố của các giá trị.
- Sự khác nhau của 2 loại biểu đồ: Đối với biểu đồ thanh (bar chart) được sử dụng khi một biến có tính chất định tính và nhận một số giá trị riêng biệt. Còn biểu đồ Histogram được sử dụng khi một biến mang tính định lượng, lấy giá trị số.
Biểu đồ so sánh giá trị giữa các nhóm.
Với mục đích là so sánh giữa các nhóm, tức là bạn có nhiều nhóm và cần so sánh giá trị với nhau. Ví dụ như giá trị giữa doanh thu, lợi nhuận của năm 2023 và doanh thu và lợi nhuận của học thuê .net năm 2024
Biểu đồ thanh (cluster bar chart) so sánh các giá trị giữa các nhóm bằng cách gán một thanh cho mỗi nhóm.
Ngoài ra, biểu đồ đường (line chart) có thể được sử dụng để so sánh giá trị giữa các nhóm theo thời gian bằng cách vẽ một đường cho mỗi nhóm.
Biểu đồ để quan sát mối quan hệ giữa các biến
Trong quá trình khám phá dữ liệu để tìm hiểu mối quan hệ giữa các biến là một vấn đề quan trọng. Hiểu mối quan hệ khác nhau giữa các biến, tức là biến này thay đổi như thế nào so với biến kia; mối quan hệ là tuyến tính hay bậc hai hay nghịch đảo hay logarit hay cái gì khác?
Các loại biểu đồ bên dưới có thể được sử dụng để vẽ hai hoặc nhiều biến số với nhau nhằm quan sát các xu hướng và mô hình giữa chúng. Theo kinh nghiệm của hocthue.net thì nên giới hạn ở 2 biến cho dễ nghiên cứu.
Biểu đồ phân tán và bản đồ nhiệt là một trong những loại biểu đồ có thể được sử dụng để hiển thị sự phân bổ trong các giá trị dữ liệu. Biểu đồ phân tán là cách tiêu chuẩn để thể hiện mối quan hệ giữa hai biến.
Kinh nghiệm của hocthue.net thì bạn nên dùng PowerBI để thể hiện những biểu đồ phức tạp như thế này.
Kết luận
Trên đây chỉ là hướng dẫn chung về biểu đồ trong luận văn, tiểu luận hoặc bài tập lớn mà dịch vụ hocthue.net thường gặp. Để học việc sử dụng biểu đồ thì bạn cần nghiên cứu, thử nghiệm nhiều lần để học tập kinh nghiệm thu được. Để bắt đầu, tốt hơn là nên giữ từng biểu đồ đơn giản và rõ ràng nhất. Sau đó là làm quen để có thể hơn là sử dụng biểu đồ phức tạp. Ở mức cao nhất, bạn sử dụng nhiều biểu đồ để so sánh, thể hiện xu hướng và thể hiện mối quan hệ giữa nhiều biến số để làm cho luận văn, báo cáo, tiểu luận của mình trở nên chuyên nghiệp.