4 điều mình học được về Data Visualization & Storyboarding từ chia sẻ của Case Prep Zone tại NUS
Nay ngồi lục đống file trên Drive tự nhiên thấy phần sharing về Data Visualization tại NUS của Case Prep Zone - một công ty chuyên về case interview prep consulting/Coaching mà hồi xưa sếp cho đi học ké :))) mình đọc lại thấy có nhiều điểm khá thú vị, và cũng hữu ích trong việc làm report nên viết lại thành post tử tế để share với mọi người và cũng là để tự mình nhớ lại luôn :))))
Tại sao Data Visualization lại quan trọng?
Data Visualization (trực quan hóa dữ liệu) thường được mọi người nhắc đến với khá nhiều những lợi ích:
Giúp dễ dàng nhận ra các xu hướng từ dữ liệu (Discovering Patterns and Trends)
Giúp truyền tải thông tin phức tạp một cách trực quan, dễ hiểu hơn (Effective Communication of Insights)
Giúp đưa ra các quyết định nhanh chóng hơn (Improving Efficiency and Faster Decision Making)
…
Tuy nhiên lý do thật sự khiến cho Data Visualization trở nên thật sự quan trọng chính là:
“Humans suck at processing words, text and numbers”
Để minh họa một cách dễ hiểu hơn, bạn hãy thử nhìn vào ví dụ sau:
Đọc xong Option A chúng ta đại khái có thể nắm bắt được 2 ý chính:
Tăng trưởng mạnh mẽ của thương mại điện tử: GMV của mua sắm online tăng từ $100M năm 2019 lên $900M năm 2021 và $1B+ năm 2023 và dự báo sẽ còn tiếp tục tăng
Suy giảm của mua sắm offline: GMV của mua sắm offline giảm mạnh từ $800M năm 2019 xuống $300M năm 2021, dự đoán năm 2023 sẽ tiếp tục giảm xuống còn $250M.
>> Từ đây rút ra kết luận là online shopping là một kênh mua sắm tiềm năng để đầu tư.
Tuy nhiên, rõ ràng so với việc đọc và process rất nhiều text ở Option A, Option B cho ta thấy cùng một quan điểm đó, nhưng theo một cách trực quan hơn.
Từ hình ảnh trong Option B có thể thấy rõ ràng được rằng Online Shopping là một kênh đáng đầu tư vì có tốc độ tăng trưởng mạnh mẽ (đường màu đỏ liên tục đi lên), đặc biệt trong hoàn cảnh mà Offline Shopping (đường màu đen) đang đi xuống.
Dù bộ não con người vẫn có thể process được văn bản, giống như cách chúng ta vẫn hiểu được ý mà Option A truyền tải, tuy nhiên việc chuyển đổi dữ liệu thành hình ảnh sẽ giúp chúng ta tiếp thu thông tin nhanh hơn và ghi nhớ lâu hơn.
Vậy là bạn đã nắm được tại sao cần data visualization, câu hỏi tiếp theo là: Thực hiện trực quan hóa dữ liệu thế nào? Từ đống số liệu khô khan, làm sao biến được thành các bản báo cáo, slide đẹp mắt, thuyết phục được người nghe?
Các bước thực hiện trực quan hóa dữ liệu (Data Visualization)
Bước 1: Xác định Message muốn truyền tải
Data visualization không phải chỉ là việc tạo ra những biểu đồ đẹp, mà mục tiêu quan trọng nhất là giúp truyền tải thông tin một cách rõ ràng, dễ hiểu và thuyết phục người xem.
Nếu không có thông điệp rõ ràng, bạn có thể cố gắng nhồi nhét quá nhiều dữ liệu vào một biểu đồ, khiến người xem khó nắm bắt ý chính.
Ví dụ: Bạn muốn trình bày tăng trưởng doanh thu theo quý, nhưng lại thêm quá nhiều chỉ số khác như số lượng khách hàng, tỷ lệ chuyển đổi, lợi nhuận biên,… làm loãng thông tin.
Vì vậy, trước khi tiến hành trực quan hóa dữ liệu có một câu hỏi quan trọng mà bạn bắt buộc phải trả lời được:
What is the key message you want to deliver?
Suy cho cùng Data Visualization (đồ thị, chart,...) dù quan trọng, nhưng nó không phải là đích đến cuối cùng (end goal) mà chỉ là công cụ để giúp chúng ta trả lời câu hỏi của business, giúp kể 1 câu chuyện hay để thuyết phục người nghe.
Bước 2: Chọn đúng loại chart để minh họa cho dữ liệu
Có rất nhiều loại chart có thể sử dụng để minh họa cho dữ liệu, tuy nhiên với 4 loại biểu đồ cơ bản sau đây bạn có thể giải quyết hầu hết các nhu cầu trực quan hóa trong kinh doanh.
Biểu đồ cột (Bar Chart)
Biểu đồ cột thường được sử dụng để thể hiện xếp hạng (rank) và biến động theo thời gian (changes over time).
Tùy vào từng “message” muốn truyền tải mà bạn có thể sử dụng biểu đồ cột theo các cách khác nhau:
1 element: Biểu đồ cột đơn giản hiển thị một yếu tố
Ví dụ:
Doanh thu của các cửa hàng trong một chuỗi bán lẻ (Store A, Store B, Store C,...)
Số lượng học viên đăng ký theo từng khóa học trong một tháng (Marketing, Data Analysis, Finance...)
Multiple elements: Biểu đồ so sánh nhiều yếu tố
Ví dụ:
So sánh doanh số của từng sản phẩm theo từng quý - Sản phẩm A, B trong Q1, Q2, Q3, Q4
Số lượng khách hàng mới và khách hàng quay lại theo từng tháng
Multidimensional: Kết hợp biểu đồ cột và đường để thể hiện mối quan hệ giữa nhiều chiều dữ liệu
Ví dụ:
Lượng khách truy cập website hàng tháng (biểu đồ cột) và tỷ lệ chuyển đổi thành khách hàng mua hàng (đường xu hướng).
Doanh thu của từng sản phẩm (biểu đồ cột) và tỷ lệ tăng trưởng theo năm (đường xu hướng).
Range: Biểu đồ thể hiện phạm vi giá trị, có thể là giá trị min-max hoặc sự biến động theo thời gian
Ví dụ:
Biểu đồ hiển thị giá cổ phiếu của một công ty trong 12 tháng, với giá trị cao nhất, thấp nhất, trung bình).
Thời gian hoàn thành dự án của các team khác nhau, với phạm vi min-max.
Pair bar chart: Biểu đồ cột ngang đối xứng để so sánh hai tập dữ liệu
Ví dụ:
So sánh lương trung bình giữa nam và nữ trong từng ngành nghề.
So sánh tỷ lệ sử dụng kênh quảng cáo giữa hai nhóm tuổi (Ví dụ: Gen Z vs Millennials sử dụng Facebook, TikTok, YouTube).
Biểu đồ tròn (Pie chart)
Biểu đồ tròn (Pie Chart) được sử dụng để thể hiện tỷ lệ phần trăm của các thành phần trong tổng thể.
Ví dụ:
Tỷ lệ doanh thu của từng dòng sản phẩm trong tổng doanh thu công ty.
Tỷ lệ người dùng theo hệ điều hành (Windows, macOS, Linux).
Biểu đồ cột chồng (Stacked bar chart)
Tương tự như biểu đồ tròn, biểu đồ cột chồng hiển thị sự phân bổ của từng thành phần trong tổng thể, ngoài ra còn cho phép so sánh giữa các danh mục khác nhau.
Có hai loại biểu đồ cột chồng chính:
Stacked Bar Chart (Cột chồng giá trị tuyệt đối): Thể hiện tổng giá trị của từng danh mục, trong đó các thành phần riêng lẻ được chồng lên nhau.
Ví dụ: Doanh thu theo từng khu vực (East, West, North), trong đó từng phần thể hiện doanh thu từ các dòng sản phẩm khác nhau.
Stacked Bar Chart được sử dụng khi:
Cần hiển thị cả giá trị tổng và giá trị của từng phần
Muốn so sánh quy mô tổng thể giữa các nhóm
Phân tích xu hướng tăng/giảm về mặt giá trị tuyệt đối
100% Stacked Bar Chart (Cột chồng tỷ lệ phần trăm): Thể hiện tỷ lệ phần trăm của từng thành phần trong tổng thể.
Ví dụ: Tỷ lệ nhân viên theo giới tính trong từng phòng ban, bất kể tổng số nhân viên mỗi phòng khác nhau.
100% Stacked Bar Chart được sử dụng khi:
Muốn phân tích cơ cấu, tỷ trọng của từng phần
Cần so sánh tỷ lệ phần trăm giữa các nhóm
Không quan trọng giá trị tuyệt đối
Biểu đồ bong bóng (Bubble Chart)
Biểu đồ bong bóng dùng để hiển thị ba biến số cùng lúc.
Ví dụ: Thể hiện hiệu suất sản phẩm dựa trên ba yếu tố: thị phần, biên lợi nhuận và doanh số, trong đó:
Trục X: Profit Margin (Biên lợi nhuận, %).
Trục Y: Market Share (Thị phần, %).
Kích thước của bong bóng: Sales (Doanh số bán hàng, thể hiện bằng độ lớn của bong bóng).
Bước 3: Tối ưu chart theo các nguyên tắc trực quan hóa dữ liệu (Data Visualization Principles)
Bên cạnh chọn đúng loại chart, vẫn có nhiều yếu tố khác có thể khiến cho phần Data Visualization của bạn trở nên rối rắm, khó hiểu, không truyền đạt được đúng “message”, follow theo 5 nguyên tắc sau đây sẽ giúp bạn tránh khỏi phần lớn các lỗi trực quan hóa dữ liệu thường gặp.
#1. Order Matters (Thứ tự quan trọng)
Hãy nhìn vào ví dụ sau đây:
Trong biểu đồ trên, người dùng muốn nhấn mạnh Japan đang xếp thứ 6 về khí thải CO2 nhưng dữ liệu trong Bar Chart không theo thứ tự rõ ràng, Japan bị lẫn lộn giữa nhiều quốc gia khác, làm người xem khó thấy được thứ hạng của nó một cách trực quan.
Sau khi chỉnh sửa, có thể thấy số liệu của các quốc gia đã được sắp xếp theo thứ tự giảm dần, giúp thể hiện rõ được Japan đang ở vị trí thứ 6.
Bài học rút ra: Khi sử dụng Bar Chart hoặc các biểu đồ dạng danh mục, nên sắp xếp dữ liệu theo thứ tự hợp lý (giảm dần/tăng dần) để giúp người xem nắm bắt thông tin dễ dàng hơn.
#2. Color Matters (Màu sắc quan trọng)
Hãy cùng xem qua ví dụ sau đây:
Từ đồ thị trên có thể thấy tất cả các đường dữ liệu có màu sắc nổi bật giống nhau, khiến biểu đồ trở nên khó đọc, không biết nên tập trung vào đâu vì không có sự phân biệt về mức độ quan trọng của từng đường dữ liệu.
Ở biểu đồ thứ 2, các thông tin ít quan trọng được chuyển thành màu xám, giúp tập trung sự chú ý vào xu hướng quan trọng (YouTube).
Bài học rút ra: Hãy sử dụng màu sắc hợp lý để làm nổi bật thông tin quan trọng, đồng thời giảm thiểu sự nhiễu loạn từ các dữ liệu ít quan trọng hơn!
#3. Consistency Matters (Sự nhất quán quan trọng)
Hãy tiếp tục xem một ví dụ sau đây:
Hai biểu đồ cột cho Retailer A và Retailer B đang sử dụng đơn vị đo lường khác nhau:
Retailer A dùng đơn vị Billions (tỷ chai).
Retailer B dùng đơn vị Millions (triệu chai).
Sự không đồng nhất về đơn vị làm cho việc so sánh giữa hai Retailer trở nên khó khăn và gây hiểu lầm (Retailer B bán được nhiều Green Tea hơn Retailer A).
Sau khi tối ưu, cả hai Retailer đã được đưa về cùng một đơn vị đo lường: Millions (triệu chai). Ngoài ra, dữ liệu cũng được thể hiện lại dưới dạng bảng so sánh, giúp người xem dễ dàng đối chiếu, so sánh sự khác biệt.
Bài học rút ra: Khi trực quan hóa dữ liệu cần đảm bảo sự nhất quán về cả đơn vị đo lường, màu sắc và kiểu trình bày.
#4. Simplicity Matters (Sự đơn giản quan trọng)
Hãy cùng nhìn vào 2 đồ thị dưới đây:
Ở biểu đồ bên trái, giao diện biểu đồ quá phức tạp, gây rối mắt cho người xem:
Màu nền tối và quá nhiều màu sắc đậm làm khó nhìn.
Phần chú thích (legend) không cần thiết vì các category đã được thể hiện bằng cả text lẫn màu sắc.
Ở biểu đồ bên phải biểu đồ đã được đơn giản hóa, khiến dữ liệu dễ đọc hơn, nhưng không mất đi ý nghĩa cốt lõi.
Bài học rút ra: Cố gắng làm cho chart trở nên đơn giản hết sức có thể nhưng vẫn thể hiện được thông tin.
Hãy tự hỏi bản thân 2 câu hỏi này để kiểm tra lại xem biểu đồ đã đạt yêu cầu này chưa:
Is that anything that this chart is not Self Explanatory? (nếu mà không có ai giải thích thì có thể tự đọc hiểu được không)
Is there any information that is unnecessary?
#5. True Matters (Sự trung thực quan trọng)
Cùng nhìn vào ví dụ về cuộc thăm dò ý kiến về việc nước Anh rời EU:
Ở hình bên trái, trục Y không bắt đầu từ 0 mà từ 45%, tạo ra hiệu ứng phóng đại khoảng cách giữa hai giá trị (Leave: 52% vs Stay: 48%). Khi nhìn vào biểu đồ này, người xem có thể bị hiểu lầm rằng số người chọn "Leave" cao hơn hẳn "Stay", trong khi thực tế chỉ chênh lệch 4%.
Ở biểu đồ bên phải, trục Y đã được điều chỉnh lại để bắt đầu từ 0%, giúp biểu đồ phản ánh chính xác hơn tỷ lệ phiếu bầu (52% và 48%).
Bài học rút ra: Không nên sử dụng kỹ thuật trực quan để định hướng hoặc thao túng nhận thức của người xem mà cần đảm bảo dữ liệu phải phản ánh đúng thực tế.
Bước 4: Sắp xếp thông tin & trình bày thành báo cáo (Storyboarding)
Sau khi đã phân tích, trực quan hóa dữ liệu, tìm ra các insight, ta sẽ cần phải trình bày chúng thành dạng báo cáo để trình bày với sếp, teammate, đối tác,...
Trước khi bắt tay vào thiết kế báo cáo, nên bắt đầu với 1 câu chuyện trước, các slide hay các phần trong báo cáo sẽ cần kết hợp với nhau để kể câu chuyện đó.
Để minh họa dễ hiểu hơn, hãy quay lại ví dụ ở phần 1, câu hỏi đặt ra (Business question) ở đây là: Công ty có nên đầu tư vào Ecommerce Business ở US không?
Nếu câu trả lời là Yes >> Why Yes? >> Các lý do để support cho câu trả lời này là gì?
Ví dụ:
Luận điểm 1: Ecommerce ở US có tỷ lệ tăng trưởng tốt (leading)
Luận điểm 2: Công ty có mạng lưới, tài nguyên ở US có thể support tốt cho business này
Luận điểm 3: Sản phẩm của công ty phù hợp với thị hiếu của người dùng ở US > người dùng có khả năng mua sản phẩm của mình hơn của đối thủ
Structure để trình bày báo cáo sẽ là:
Slide đầu tiên thể hiện luận điểm Yes, nên đầu tư vào Ecommerce Business ở US
Slide support 1: Thể hiện luận điểm 1
Slide support 2: Thể hiện luận điểm 2
Slide support 3: Thể hiện luận điểm 3
Có thể xem hình minh họa dưới đây để dễ hình dung:
Ngoài 4 slide trên thì hoàn toàn có thể đào sâu, làm báo cáo một cách detail hơn, ví dụ:
Đây cách sắp xếp theo hướng Inductive Logic - nghĩa là các ý sẽ separate với nhau để hỗ trợ cho một luận điểm chính.
Bạn cũng có thể tìm hiểu thêm về Deductive Logic - Các ý có liên quan đến nhau, ý sau là hậu quả của ý trước.
Lưu ý khi thiết kế báo cáo: Conclusion trước, details second
Bởi người đọc/người nghe thường không có thời gian nghe trình bạn trình bày dài dòng, bạn cần đưa cần nghe kết luận trước, sau đó mới bắt đầu giải thích, đưa ra các bằng chứng, con số minh họa cho kết luận của mình.
Và cuối cùng, sau khi đã hoàn thành các bước ở trên và có được một bản báo cáo hoàn chỉnh, bạn có thể kiểm tra lần cuối với các câu hỏi sau đây:
Hết bài rồi :)))
Có một câu mình rất thích "A picture is worth a thousand words", tuy nhiên nếu hình ảnh (trong trường hợp này là biểu đồ) đó không được thiết kế tốt thì vẫn có thể gây hiểu lầm, thậm chí làm rối loạn thông tin hơn là hỗ trợ cho việc truyền tải thông tin.
Data Visualization & storytelling nhìn thế thôi nhưng không đơn giản chút nào, có lẽ sẽ phải mất nhiều thời gian mới master được. Hy vọng phần note của mình sẽ hữu ích cho bạn trong hành trình này. Nếu bạn thấy bài post này hay thì hãy chia sẻ cho mọi người cùng đọc nha và đừng quên subscribe để nhận noti về các bài post mới của mình 😉
À nếu ai hỏi có thể học thêm được những kiến thức về data từ NUS ở đâu thì một là vào làm đồng nghiệp với mình để đi nghe ké :))) không thì có thể học qua các khóa học sếp mình làm giáo trình và dạy nhá