/ / Cách tính toán mối tương quan trong Google Trang tính

Cách tính toán mối tương quan trong Google Trang tính

Trong khi sử dụng Google Trang tính để làm việc với hai tập dữ liệu, bạn có thể muốn so sánh hai tập dữ liệu này bằng cách xác định mức độ ảnh hưởng của tập hợp này với tập dữ liệu kia.


Các mối tương quan có thể cung cấp cái nhìn sâu sắc về việc liệu có mối quan hệ tiên đoán giữa các mặt phẳng x và y hay không, nhưng chúng không nhất thiết chỉ ra mối quan hệ nhân quả. Đây là cách bạn có thể sử dụng Google Trang tính để xác định các mối tương quan trong dữ liệu của mình.


Tương quan là gì, và bạn có thể sử dụng nó để làm gì?

Khi hai biến số có tương quan với nhau, người ta có thể xác định cách một biến số tác động đến biến số kia. Nhưng, điều quan trọng cần nhớ là mối tương quan không bao hàm sự phụ thuộc trong trường hợp này; nó chỉ cho thấy hai biến số so sánh hoặc liên quan chặt chẽ và nhanh chóng như thế nào.

Các chỉ số thống kê giúp hiểu được các xu hướng cơ bản trong phân tích dữ liệu. Tương quan là một trong những số liệu thống kê thường được sử dụng nhất và nó xác định mức độ liên quan chặt chẽ hoặc phụ thuộc của hai biến.

Hiểu Hệ số Tương quan trong Google Trang tính

Trong Google Trang tính, hệ số tương quan được tính bằng hàm CORREL. Hệ số tương quan đóng vai trò là thước đo mức độ kết nối chặt chẽ giữa các bộ dữ liệu. Nó có thể được sử dụng để lấy hệ số tương quan thời điểm sản phẩm Pearson (r) nếu bạn có hai bộ dữ liệu thay đổi. Nếu bạn muốn tìm hiểu thêm về hệ số này, bạn có thể đọc thêm trong hướng dẫn này từ Statistics at Leard.

Người ta có thể bắt gặp một trong ba số liệu tương quan. Mọi phép đo xác định mối quan hệ giữa các biến theo cách khác nhau. Giá trị của nó nằm trong khoảng từ -1 đến +1:

  • -1 biểu thị mối tương quan âm hoàn hảo: Khi một mối tương quan có hệ số tương quan bằng hoặc dưới -0,9, nó được cho là có giá trị âm. Đó là một dấu hiệu cho thấy dữ liệu đang tương quan. Tuy nhiên, biến x tiếp tục tăng, trong khi biến y tiếp tục giảm.
  • 0 biểu thị không có kết nối: Các biến được coi là không tương quan nếu hệ số tương quan lớn hơn 0,01 nhưng nhỏ hơn 0,1 vì không có mối quan hệ rõ ràng giữa mỗi biến. Chúng độc lập với nhau.
  • +1 biểu thị mối tương quan thuận hoàn hảo: Khi hệ số của mối tương quan rơi vào giữa 0,9 và 1, nó được coi là rất tích cực. Nó chỉ ra rằng đã có sự gia tăng trong hai tập hợp biến.

Giá trị cao nhất của hệ số có thể là hệ số tương quan bằng 1. Khi giá trị tương quan là 1, điều đó ngụ ý rằng nếu bạn vẽ biểu đồ dữ liệu, dữ liệu sẽ được căn chỉnh hoàn toàn để tạo ra một đường thẳng.

Nếu bạn vẫn còn một chút lạc lối, đừng lo lắng. Chúng tôi sẽ giải thích cú pháp của hàm CORREL và sau đó đi sâu vào một số ví dụ trong thế giới thực để giúp bạn hiểu rõ hơn. Việc hiểu các đường phù hợp nhất và cách tạo các đường xu hướng trong Google Trang tính sẽ giúp bạn điều này.

Cú pháp hàm CORREL trong Google Trang tính

=CORREL(data_y, data_x)  

Hãy chia điều này thành các phần của nó và hiểu rõ hơn mọi cụm từ có nghĩa là gì:

  • = CORREL: Đây là hàm Google Trang tính xác định r, (hệ số tương quan thời điểm sản phẩm Pearson của tập dữ liệu).
  • data_y: Điều này đề cập đến nhóm ô chứa dữ liệu phụ thuộc hoặc phạm vi giá trị cho các ô đó.
  • dữ liệu x: Đây là một tham chiếu hướng tới mảng ô có dữ liệu độc lập hoặc phạm vi giá trị cho các ô đó.

Nếu bạn vẽ biểu đồ các điểm dữ liệu, data_y sẽ là trục Y và data_x là trục X. Bạn sẽ nhận thấy rằng có hai cách khác nhau để nhập phạm vi dữ liệu. Phạm vi ô tham chiếu hoặc mục nhập dữ liệu thẳng trong hàm là các tùy chọn.

Trong hầu hết các trường hợp, việc sử dụng phạm vi ô tham chiếu được ưu tiên hơn. Đó là bởi vì bảng tính rất có thể đã chứa dữ liệu của bạn. Sử dụng phạm vi ô tham chiếu có thể tránh nhập quá nhiều dữ liệu có thể dẫn đến lỗi người dùng.

Ví dụ về hàm CORREL trong Google Trang tính

Hãy xem một vài ví dụ để hiểu cách sử dụng hàm CORREL trong Google Trang tính.

Ví dụ 1: Tương quan Tích cực Mạnh

Đối với ví dụ đầu tiên này, hãy giả sử chúng ta đang làm việc trong ngành bất động sản. Trong bảng tính dưới đây, chúng tôi có các phân vùng diện tích đất mà bạn đang bán và số lượng đơn vị đã bán trong dữ liệu của các khu đất khác nhau đó trong Google Trang tính của bạn.

  1. Nếu bạn đang theo dõi trong một trang tính, bạn sẽ bắt đầu bằng cách nhập dữ liệu của các biến vào bảng tính của mình, như được hiển thị bên dưới:

  2. Nhấp vào ô C2
  3. Loại hình = CORREL (

  4. Sau đó, bạn sẽ tiến hành nhập data_y, trong trường hợp của chúng tôi, là phạm vi ô được tham chiếu A2: A6, sau đó nhập dấu phẩy.
  5. Tiếp tục nhập data_x, trong trường hợp của chúng tôi, được tham chiếu là B2: B6.
  6. Kết thúc bằng dấu ngoặc nhọn, như hình dưới đây:

  7. Cuối cùng, nhấn đi vào để trả về hệ số tương quan của hai phần dữ liệu trong ô C2.

Sử dụng ví dụ vừa hiển thị ở trên, bạn đã thu được hệ số tương quan là 0,90, đây là một hệ số tương quan thuận mạnh vì giá trị của nó nằm trong khoảng 0,9 và 1. Do đó, điều này cho thấy rằng khi y thay đổi, x cũng thay đổi theo cách có thể so sánh đáng kể.

Dưới đây là phần trình bày dữ liệu mẫu ví dụ của chúng tôi trên biểu đồ phân tán XY. Như bạn có thể thấy, đường phù hợp nhất gần với các điểm dữ liệu trên biểu đồ, hỗ trợ ý tưởng rằng các số liệu có tương quan chặt chẽ với nhau.

Bạn có thể tìm hiểu thêm về cách tạo biểu đồ phân tán XY trong Google Trang tính trong bài viết khác của chúng tôi.

Ví dụ 2: Tương quan phủ định yếu

Lần này, chúng tôi sẽ sử dụng một ví dụ chung chung hơn về “biến x và y” trong bảng tính của chúng tôi. Chúng tôi đã đưa vào các số liệu một cách có chủ đích để chứng minh mối tương quan nghịch, mà hàm CORREL thể hiện bên dưới:

Không có mối quan hệ chặt chẽ giữa các biến y và x, vì vậy kết quả chúng ta nhận được là một hệ số tương quan ít có ý nghĩa hơn trong ví dụ trước. Kết quả chúng tôi đạt được là -0,47. Tuy nhiên, điều này không ngụ ý rằng không có mối tương quan nào cả. Hãy cùng xem xét lại dòng phù hợp nhất để hiểu rõ hơn về nó.

Như bạn có thể thấy bằng biểu đồ phân tán, các điểm dữ liệu nằm xa dòng phù hợp nhất. Do đó, có ít mối tương quan hơn trong ví dụ đầu tiên, nhưng không phải là không có. Bạn cũng sẽ nhận thấy rằng dòng phù hợp nhất đang giảm dần. Điều này cho thấy mối tương quan nghịch, một giá trị giảm khi giá trị kia tăng lên.

Ví dụ 3: Không có kết nối

Ở đây chúng ta có một tập hợp các số hoàn toàn ngẫu nhiên. Hãy nhanh chóng tìm hiểu cách sử dụng lại hàm CORREL:

  1. Nhập vào ô C2 công thức CORREL
  2. Lập luận của chúng tôi là A2: A10B2: B10
  3. Nhấn Enter

Giá trị trả về trên C2 là 0,02. Nếu hệ số tương quan nằm trong khoảng từ 0,01 đến 0,1, thì được xác định rằng các biến được đề cập không tương quan vì không có mối liên hệ rõ ràng nào giữa chúng. Mối quan hệ giữa các biến là hoàn toàn độc lập.

Dưới đây là biểu diễn của cùng một biểu đồ phân tán. Đường phù hợp nhất gần như bằng phẳng, cho thấy có ít mối tương quan giữa hai tập dữ liệu.

Dễ dàng liên kết dữ liệu của bạn trong Google Trang tính

Tương quan có thể là một chủ đề khó khăn nếu bạn không làm việc nhiều với nó ở trường trung học. Hướng dẫn này bao gồm tất cả những điều cơ bản, nhưng bạn sẽ cần tiếp tục sử dụng chức năng CORREL trong Google Trang tính để giữ cho nó luôn mới trong tâm trí bạn.

Đây là một chức năng mạnh mẽ vì nó giúp tránh xây dựng biểu đồ phân tán và có thể nhanh chóng tìm ra xu hướng trong dữ liệu của bạn. Tuy nhiên, đừng ngại thêm biểu đồ để giúp những người dùng khác hiểu rõ hơn về dữ liệu trong bảng tính của bạn.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *