Cách lấy mẫu hoạt động trong Google Analytics

Cách lấy mẫu hoạt động trong Google Analytics


Thông tin cơ bản

Lấy mẫu trong Google Analytics (GA) hoặc trong bất kỳ phần mềm phân tích web nào đề cập đến thực tiễn chọn tập hợp con dữ liệu từ lưu lượng truy cập trang web của bạn và báo cáo về các xu hướng có sẵn trong tập hợp mẫu đó. Lấy mẫu được sử dụng rộng rãi trong phân tích thống kê bởi vì phân tích tập hợp con dữ liệu sẽ cho kết quả tương tự với phân tích tất cả dữ liệu. Ngoài ra, lấy mẫu sẽ tăng tốc việc xử lý báo cáo khi khối lượng dữ liệu quá lớn sẽ làm chậm các truy vấn báo cáo.
 

Lấy mẫu phiên

Cách báo cáo chuẩn hoạt động

Mỗi thuộc tính web trong Google Analytics đều lưu trữ bản sao của tất cả dữ liệu chưa được lọc được kết hợp với ID thuộc tính web duy nhất. Mỗi tiểu sử được kết hợp với thuộc tính web sẽ tạo một bộ các bảng dữ liệu chưa được lấy mẫu, được tổng hợp trước, được xử lý trên cơ sở hàng ngày. Bộ báo cáo Google Analytics chuẩn dựa trên các bảng được tổng hợp trước này để phân phối báo cáo chưa được lấy mẫu đúng thời gian.
 
Ngoài báo cáo chuẩn, người dùng có thể phát hành truy vấn đặc biệt cho Google Analytics. Truy vấn phổ biến bao gồm việc áp dụng phân đoạn nâng cao cho báo cáo chuẩn, áp dụng thứ nguyên phụ hoặc chạy báo cáo tùy chỉnh. Khi giao diện phát hành truy vấn, GA kiểm tra tập hợp các bản được tổng hợp trước để xác định xem truy vấn có thể được các tổng hợp hiện tại đáp ứng hoàn toàn hay không. Nếu không, GA sẽ trở lại dữ liệu thô của phiên để xử lý và tính toán dữ liệu tổng hợp nhanh chóng. Nếu báo cáo kết quả được lấy mẫu, bạn sẽ luôn thấy hộp màu vàng ở đầu báo cáo có nội dung: Báo cáo này dựa trên N lượt truy cập.

Cách báo cáo đặc biệt hoạt động

Như đã thảo luận, trong trường hợp truy vấn báo cáo không được đáp ứng bởi các tổng hợp hiện tại (nghĩa là các bản được tổng hợp trước), GA sẽ trở lại dữ liệu thô của phiên để tính toán thông tin được yêu cầu. Để giảm thời gian chờ, GA có thể lấy mẫu dữ liệu phiên cho các truy vấn như vậy. Cụ thể, GA kiểm tra số lượt truy cập cho phạm vi ngày được chỉ định ở cấp thuộc tính web. Nếu số lượt truy cập đến thuộc tính web trong phạm vi ngày nhất định vượt quá 250.000 lượt truy cập1, GA sẽ sử dụng thuật toán lấy mẫu sử dụng tập hợp 250.000 lượt truy cập mẫu, cân xứng với phân phối lượt truy cập theo ngày cho phạm vi ngày đã chọn. Do đó, tỷ lệ lấy mẫu phiên khác nhau đối với mỗi truy vấn tùy thuộc vào số lượt truy cập được bao gồm trong phạm vi ngày đã chọn cho thuộc tính web nhất định. Lưu ý rằng kích thước lấy mẫu có thể được định cấu hình ở bất kỳ nơi nào từ 1.000 đến 500.000 lượt truy cập; kích thước mặc định là 250.000.

Ngụ ý cho tiểu sử được lọc và phân đoạn nâng cao

Điều quan trọng cần lưu ý là lấy mẫu phiên xảy ra ở cấp thuộc tính web, không ở cấp tiểu sử. Đối với truy vấn đặc biệt, tập hợp 250.000 lượt truy cập mẫu2 được xác định ở cấp thuộc tính web và sau đó bộ lọc cấp tiểu sử được áp dụng. Như vậy, tiểu sử được lọc có thể có một vài lượt truy cập được bao gồm trong tính toán đã lấy mẫu. Tương tự, phân đoạn nâng cao được áp dụng sau khi 250.000 lượt truy cập được lấy mẫu, vì vậy, ít lượt truy cập hơn có thể được đưa vào tính toán.
 
Nói chung, lấy mẫu phiên là phương tiện hiệu quả cao trong việc giảm thời gian chờ truy vấn trong khi vẫn duy trì mức chính xác cao. Cụ thể, phương pháp lấy mẫu của GA hoạt động rất tốt cho N truy vấn nhanh, hàng đầu và các truy vấn khác có phân phối rộng, đồng nhất tương đối qua các lượt truy cập. Lấy mẫu phiên có thể ít chính xác cho các vấn đề 'khó có thể thực hiện được', chẳng hạn như phân tích một từ khóa và phân tích lâu dài hoặc các trường hợp có tính năng lọc thứ nguyên hẹp, chẳng hạn như tiểu sử được lọc quá nhiều hoặc phân tích chuyển đổi nơi chuyển đổi tạo thành một phần nhỏ của các lượt truy cập. Đối với các loại phân tích đó, vui lòng tham khảo phần truy cập báo cáo chưa được lấy mẫu với tài khoản GA đặc biệt.
 

Tập hợp giá trị thứ nguyên

Cách báo cáo chuẩn hoạt động

Như được thảo luận, các bản đã tổng hợp trước trên mỗi tiểu sử được xử lý trên cơ sở hàng ngày. Các bảng này báo cáo dữ liệu trên tất cả các phiên, mặc dù có giới hạn đối với số lượng hàng/giá trị khác biệt trong các bảng được tổng hợp trước3. GA tổng hợp dữ liệu khi có hơn 50.000 hàng4 dữ liệu trong một bảng vào một ngày. Nói cách khác, khi có hơn 50.000 giá trị cho một bản nhất định, GA sẽ lấy các giá trị N5 hàng đầu và tạo mục tổng hợp cho các giá trị còn lại có nhãn “(khác)”.

Ngụ ý cho yêu cầu nhiều ngày

Điều quan trọng cần lưu ý là N mục hàng đầu được xác định trên cơ sở mỗi ngày. Ví dụ: nếu bạn chọn bất kỳ một ngày nào trong báo cáo Trang, bạn sẽ thấy tối đa 50.000 hàng; tất cả các trang khác được tổng hợp vào danh mục "(khác)". Do đó, trang được nhóm trong danh mục "(khác)" một ngày có thể không cần thiết được nhóm trong danh mục "(khác)" vào một ngày khác. Vì vậy, khi chạy báo cáo cho phạm vi ngày nhiều ngày, bạn có thể gặp phải sự không đồng nhất vì một số trang (hoặc giá trị thứ nguyên khác) về lâu dài có thể được bao gồm trong bộ chứa "(khác)" hoặc hàng của riêng nó qua các ngày.
 
Ngoài ra, đối với yêu cầu nhiều ngày, số lượng hàng tối đa được đọc mỗi ngày là (1triệu/n), trong đó n là số ngày trong truy vấn. Do đó, đối với bất kỳ yêu cầu nào có phạm vi ngày bao gồm hơn 20 ngày, có khả năng GA sẽ cắt bớt số hàng được đọc cho ngày, nếu có đầy đủ 50.000 hàng dữ liệu. Ví dụ:
  • Báo cáo cho 30 ngày qua sẽ đọc khoảng 30.000 hàng mỗi ngày (ví dụ: 1.000.000/30).
  • Báo cáo cho 60 ngày qua sẽ đọc tối đa 16.000 hàng mỗi ngày (ví dụ: 1.000.000/60).
Bởi vì các giá trị thứ nguyên (ví dụ: các URL duy nhất và từ khóa của chiến dịch) thường lặp lại trong các ngày nhất định, nên ngưỡng này thường chỉ ảnh hưởng đến trang web có nhiều nội dung và/hoặc từ khóa độc đáo.

Cách báo cáo đặc biệt hoạt động

Trong trường hợp truy vấn của người dùng không thể được các tổng hợp hiện tại đáp ứng (nghĩa là các bảng được tổng hợp trước), GA sẽ trở lại dữ liệu thô của phiên để tính toán thông tin được yêu cầu. Trong tình huống đó, GA sẽ trở lại mức tối đa 1 triệu giá trị thứ nguyên duy nhất được bao gồm trong tập hợp mẫu cho truy vấn.
 

Báo cáo khác

Báo cáo lấy mẫu và báo cáo kênh đa kênh

Báo cáo kênh đa kênh dựa trên 1 triệu chuyển đổi. Nếu số lượng chuyển đổi vượt quá 1 triệu trong phạm vi ngày nhất định, khi đó GA lấy mẫu tối đa 1 triệu hiển thị ở cấp tiểu sử. Lưu ý rằng lấy mẫu xảy ra ở cấp tiểu sử, không phải cấp thuộc tính web, cho báo cáo MCF.
 
Ngoài ra, số lượng đường dẫn chuyển đổi duy nhất tối đa là 200.000 mỗi ngày. Tất cả đường dẫn chuyển đổi khác được tổng hợp trong "(khác)".

Báo cáo lấy mẫu và báo cáo hình ảnh hóa dòng

Báo cáo hình ảnh hóa dòng (bao gồm Luồng khách truy cập và Luồng mục tiêu) tạo ra một tập hợp con 100.000 lượt truy cập cho phạm vi ngày nhất định. Tương tự như lấy mẫu phiên báo cáo chuẩn, 100.000 lượt truy cập được lấy mẫu ở cấp thuộc tính web. Do đó, việc áp dụng bộ lọc tiểu sử hoặc phân đoạn nâng cao có thể giảm hơn nữa kích thước tập hợp mẫu.
 
Vì lý do này, báo cáo hình ảnh hóa dòng, bao gồm tỷ lệ truy cập, tỷ lệ thoát và tỷ lệ chuyển đổi có thể khác với kết quả trong báo cáo nội dung và báo cáo chuyển đổi chuẩn, dựa trên một tập hợp mẫu khác.
 

Lấy mẫu thu thập dữ liệu

Nếu trang web của bạn có nhiều triệu lần xem trang mỗi tháng, bạn có thể xem xét định cấu hình mã theo dõi để lấy mẫu dữ liệu, sử dụng _setSampleRate method. Bằng cách lấy mẫu số lần truy cập cho trang web của mình, bạn có thể nhận được kết quả báo cáo đáng tin cậy trong khi vẫn duy trì trong giới hạn lượt truy cập cho tài khoản của mình. Giới hạn về số lượt truy cập cho tài khoản GA chuẩn là 10 triệu lượt truy cập/tháng. Đối với tài khoản Đặc biệt, giới hạn lượt truy cập là hơn 1 tỷ lượt truy cập/tháng. Lợi ích thêm của việc lấy mẫu thu thập dữ liệu là thời gian phản hồi báo cáo có thể nhanh hơn với ít dữ liệu hơn trong tài khoản.
 
Lấy mẫu thu thập dữ liệu xảy ra một cách nhất quán qua số lượng khách truy cập. Do đó, khi người dùng đã chọn thu thập dữ liệu, tất cả lượt truy cập (bao gồm lượt truy cập trong tương lai) cho người dùng sẽ gửi dữ liệu đến GA. Đối với các ứng dụng trên điện thoại di động, điều này có nghĩa là các lần tải xuống ứng dụng đã được chọn cho thu thập dữ liệu sẽ gửi tất cả dữ liệu đến GA, trong khi các trường hợp khác của ứng dụng sẽ không gửi bất kỳ lượt truy cập nào.
 
Lưu ý rằng ngay cả khi dữ liệu cho trang web của bạn không được lấy mẫu khi được thu thập, các loại báo cáo nhất định sẽ gặp các kiểu lấy mẫu khác, bao gồm lấy mẫu phiên và tổng hợp giá trị thứ nguyên, dựa trên bản chất của truy vấn. Xem Cách báo cáo đặc biệt hoạt động cho lấy mẫu phiên.
 
1 Xem điều chỉnh kích thước mẫu. Kích thước lấy mẫu có thể điều chỉnh được từ 1.000 đến 500.000 lượt truy cập.
2 Xem điều chỉnh kích thước mẫu.
3 Các bảng có thể tương ứng với một báo cáo hoặc nhiều báo cáo. Các bảng có thể chứa một thứ nguyên (ví dụ: từ khóa) hoặc nhiều thứ nguyên (ví dụ: nhóm quảng cáo và chiến dịch). Ở cấp chi tiết nhất, báo cáo sẽ chứa tối đa 50.000 hàng dữ liệu. Các cấp cao hơn trong phân cấp bảng, chẳng hạn như nhóm quảng cáo, có thể chứa ít hơn 50.000 hàng.
4 75.000 cho tài khoản GA đặc biệt.
5 Như được xác định bởi số liệu có liên quan cho báo cáo/bảng (ví dụ: số lượt truy cập, số sự kiện, số lần xem trang, số giao dịch).

0 nhận xét:

Đăng nhận xét