Google Analytics luôn là một trong những tools cực kỳ quan trọng gần như không thể thiếu của dân làm Digital Marketing, Google Analytics có rất nhiều kiểu report có sẵn khác nhau và có rất nhiều cách customize khác nhau để phù hợp hơn với từng mục tiêu của website.
Nhưng vẫn có một tồn tại khó chịu nhất trước giờ đối với người dùng là Google Analytics không chấp nhận việc tìm hiểu hành vi người dùng theo kiểu “identify an individual personally ” tạm dịch là “xác định thông tin của từng người (user) riêng biệt”.
Hôm nay mình sẽ đi chi tiết hơn về để hiểu “identify an individual personally” trong Google Analytics là gì, cách xử trí vấn đề này để track từng user trên website của bạn với Google Analytics, cũng như mong muốn được nghe quan điểm của các bạn về vấn đề này.
1/ Lợi ích của việc track từng user trên website của bạn.
Mới nghe chắc có một số bạn sẽ nghĩ là không hiện thực lắm, khá mất thời gian khi xem từng user làm gì trong hàng ngàn user tương tác trên website.
Đây là một số lợi ích mà mình thấy:
- Bạn có đau lòng không khi thấy hàng ngàn user đã “add to cart” sản phẩm của bạn nhưng lại không chịu mua và bạn thì chẳng biết trong hàng ngàn người đó ai là người “quen” mà nhân viên của bạn có thể contact trực tiếp để dụ dỗ họ mua hàng? Dùng Re-targeting thì vẫn luôn có những giới hạn về target và chi phí…
- Bạn có muốn biết những user nào thích những sản phẩm nào trên website của bạn và đưa ra offer phù hợp cũng như có cách tiếp cận tốt hơn?
- Bạn có muốn biết user nào đã tìm kiếm gì trên website của bạn để bạn có cách tiếp cận tốt hơn?
- Bạn có muốn email mình gửi ra cho user sẽ ngày càng được personalize tốt hơn?
- Bạn hoàn toàn có thể segment user theo từng nhóm theo những hoạt động của họ trên web để nhìn tổng quan hơn…và nhiều lợi ích khác…
2/ Tại sao nên dùng Google Analytics
Dùng Google Analytics cho rẻ, code nhanh, lưu trữ dữ liệu lâu dài, khả năng tương tác với các loại dữ liệu khác nhau dễ.
Ngoài ra bạn còn có những lựa chọn sau để tìm hiểu hành vi từng người dùng:
Tự làm một hệ thống quản lý khách hàng và đổ mọi data người dùng duyệt web vào hệ thống này và theo dõi trên đó (CRM). (1)
Cài đặt một hệ thống tracking riêng sử dụng các open source về tracking như Piwik, Open Web Ananlytics. (2)
Mua các hệ thống tracking individual user như Mixpanel…(3)
Sử dụng Google Analytics. (4)
Đây là góc nhìn của mình đối với các cách trên:
(1) sẽ tốn rất nhiều resource của lập trình viên quy ra tiền thì rẻ cũng vài ngàn đô, tốt tốt có khi tới mấy trăm ngàn đô, (1) và (2) đều ngốn không gian lưu trữ khá khủng, nếu website của bạn càng lớn thì việc lưu trữ và xử lý dữ liệu qua năm tháng càng trở thành nỗi ám ảnh lớn.
Một ví dụ khi mình tìm hiểu về PIWIK:
A rough estimate of Piwik Mysql database size usage is approximately 1Gb for every 5M page views. If your website tracks 100k page views per day (3M pages per month), you can expect a DB size of ~ 7Gb after 1 year.
Tất nhiên với nhà giàu thì từng này dữ liệu không nhằm nhò gì, nhưng với khoản tiền bỏ ra để xử lý khối dữ liệu này có lẽ sẽ dùng được vào nhiều việc khác tốt hơn.
(1) và (2) cũng không thể link những data được ghi nhận lại để chuyển thành dữ liệu cho các chiến dịch Re-targeting với Google Adwords.
Với (3) thì sáng sủa hơn vì hệ thống có sẵn hết nhưng vẫn có những giới hạn như bạn phải trả tiền theo dữ liệu hàng tháng cho dù bạn có xài hết lượng dữ liệu đó hay không, bạn bị giới hạn ở lượng người dùng được tracking, và giá thì có thể mắc hơn (1) và (2), như Mixpanel thì tính sơ sơ bạn sẽ phải trả ít nhất $300 - $500/ 1 tháng - 1 con số không lớn nhưng cũng làm bạn cân nhắc khá nhiều.
3/ Vấn đề về Policy với Google Anlytics
Hiểu “identify an individual personally" như thế nào?
Đây là quy định sử dụng của Google Analytics:
Ở trang Protocol policy SDK (5):
You will not upload any data that allows Google to personally identify an individual (such as certain names, Social Security Numbers, email addresses, or any similar data), or data that permanently identifies a particular device (such as a unique device identifier if such an identifier cannot be reset), even in hashed form.
Ở điều khoản số 7, quy định việc sử dụng Google Analytics có một đoạn như sau:
You will not (and will not allow any third party to) use the Service to track, collect or upload any data that personally identifies an individual (such as a name, email address or billing information), or other data which can be reasonably linked to such information by Google.
Xử “trí” vấn đề policy như thế nào?
Qua các trích dẫn và tài liệu của Googlee cung cấp trên có thể thấy Google rất nhấn mạnh vấn đề “not upload any data that allows Google to personally identify an individual” (tạm dịch ” không upload những dữ liệu mà cho phép Google biết được người đó là ai”).
Vậy nếu tất cả dữa liệu chúng ta upload (tracking) lên Google Analytics đều không phải là dữ liệu mà từ đó Google có thể xác định được người đó là ai thì sao?
Vấn đề đã được giải quyết tại đây nếu Google không thêm 1 câu thế này trong Google Anlytics Policy:
…or other data which can be reasonably linked to such information by Google.
other data ở đây mọi người thường hay hiểu là những loại dữ liệu liên quan khác và dùng để định danh được người dùng (trong ngữ cảnh của quote này).
Rất khó hiểu và nhập nhằng đúng không? Đây là một số ví dụ về việc other data không bao gồm việc upload thông tin lên Google Analytics để bạn có thể định danh được người dùng trong backend của bạn đang làm gì trên website:
Quay lại Google Analytics Policy (5):
Chỉ cần không upload những loại dữ liệu mà từ đó Google có thể định danh được người dùng.
You will not upload any data that allows Google to personally identify an individual (such as certain names, Social Security Numbers, email addresses, or any similar data), or data that permanently identifies a particular device (such as a unique device identifier if such an identifier cannot be reset), even in hashed form.
Cũng chính trên tính năng User ID, Google đã viết như sau:
Google Analytics cannot generate, assign, or manage the unique IDs that are assigned as User IDs. In a typical scenario, IDs can be generated through your authentication system, passed to an account when a user signs-in, and then sent to Google Analytics.
Ở một bài post trên group Digital Marketing Agency, bạn Dat Hoang đã chia sẻ quan điểm như sau:
…theo như mình hiểu thì đây là cách để Google khẳng định mình không vi phạm luật thôi: tôi tuân theo luật, không thu thập các thông tin PII. Còn bạn làm gì đằng sau back-end thì làm, cái này rõ ràng Google không quản được. Nếu xa hơn thì bạn cần tuyên bố trong “Data Policy” của bạn
Đơn cử như e-commerce tracking, nếu suy sâu xa ra, bạn dùng “Transaction ID” trong GA kết hợp với dữ liệu back-end của bạn thì track được tần tần tật thông tin về người dùng. Nhưng với Google, chỉ với “Transaction ID” thì không thể xác định được một người cụ thể…
Ngoài ra bạn Dat Hoang cũng chia sẻ link tới trang blog của David Simpson (Senior Developer and Solutions Architect at AppFusions), trong bài blog này có đoạn như sau:
Sending personally identifiable information (PII) to Google Analytics is strictly prohibited, but sending a unique user ID is permitted.
Thêm một thông tin trên blog của Cutroni (Analytics Evangelist tại Google)
To add Google Analytics data to a data warehouse you need to add some type of primary key to Google Analytics. In most of the work that I’ve done this key is a visitor ID. This anonymous identifier usually comes from some other system like a CRM….….I know what you’re thinking, “You can’t store personally identifiable information in Google Analytics!” But this isn’t personally identifiable information. And besides, this is the same as the transaction ID stored in the ecommerce data.Now that we’re done debating PII, we need to merge this data with other data. This is where things get complicated.
Ở đoạn trên Cutroni đã ví dụ việc lấy userID từ CRM và khẳng định đó không phải là thông tin cá nhân (personally identifiable information) và được phép sử dụng với Google Analytics, ngoài ra Cutroni cũng thực hiện động tác sử dụng dữ liệu user trên Google Analytics để so sánh với dữ liệu cá nhân trên CRM (we need to merge this data with other data).
Kết luận
4/ Một thủ thuật nhỏ để yên tâm hơn và có thêm nhiều dữ liệu hơn:
Mỗi user khi truy cập vào một website sẽ được Google Analytics gán cho một giá trị khác nhau trong cookie có dạng như sau (Universal Analytics):
_ga=1.2.286403989.1366364567;
Các bạn hãy để ý đến giá trị: 286403989
Đây chính là giá trị Google gán mỗi user khi họ truy cập vào website của bạn và con số này là duy nhất ngẫu nhiên (Google nói vậy thì cũng tin vậy).
Vì con số này là ngẫu nhiên nên việc bạn upload con số này lên Google Analytics sẽ chẳng ảnh hưởng gì đến Google Policy (làm sao để upload con số này thì hẹn một bài khác).
Từ đó bạn có thể lưu con số này lên Google Analytics và cũng gán con số này cho mỗi user trên website/CRM của bạn để định danh người dùng, với cách này bạn có thể xem thông tin từng người ngay trước khi họ trở thành khách hàng của bạn (có thể xem được cả quá trình trước và sau khi họ trở thành khách hàng của bạn từ đó sẽ hiểu rõ hơn làm sao để tăng conversion).
Có cùng góc nhìn và quan điểm? hay Khác quan điểm và góc nhìn? Hãy chia sẻ để mọi người có thêm nhiều nguồn thông tin hữu ích.
Bài viết chứa có hình minh họa phù hợp » Giới thiệu hình minh họa cho bài này
0 nhận xét:
Đăng nhận xét