Có một câu mà dân ghiền bóng đá hay nói với nhau: “Bóng đá là môn thể thao của cảm xúc, không thể dùng con số để đoán được.” Nghe thì có vẻ sâu sắc lắm. Nhưng thật ra câu đó chỉ đúng một nửa — và cái nửa sai lại đang khiến rất nhiều người phân tích trận đấu theo kiểu… nhắm mắt chỉ tay.

Tôi không phải chuyên gia thống kê. Tôi chỉ là người xem bóng đá từ hồi còn ngồi trên vai ông nội, sau đó lớn lên và bắt đầu tự hỏi tại sao mình cứ đoán sai hoài. Rồi tôi thử đọc về xG, về pressing intensity, về heat map — và nhận ra rằng cảm xúc chỉ là bề mặt. Phía dưới là cả một lớp dữ liệu mà nếu biết đọc, bạn sẽ hiểu trận đấu theo cách hoàn toàn khác.
Khi cảm xúc và con số cùng ngồi lại một bàn
Lấy ví dụ cho dễ hình dung. Bạn xem Argentina thắng Pháp 4–2 ở chung kết World Cup 2022 theo loạt sút luân lưu. Cảm xúc bảo: Argentina hay hơn. Nhưng nếu nhìn vào xG — tức là chỉ số “bàn thắng kỳ vọng” dựa trên chất lượng các cơ hội tạo ra — thì Pháp thực ra có hiệu suất tấn công không hề thua kém. Trận đó Mbappé ghi hat-trick trong vòng 97 phút. Con số nói: đây là trận đấu của hai đội đẳng cấp ngang nhau, không phải một bên áp đảo hoàn toàn.
Đó là điều dữ liệu làm được. Nó không phủ nhận cảm xúc, nó bổ sung bối cảnh mà mắt thường hay bỏ qua.
Thực ra, các đội bóng lớn dùng dữ liệu từ lâu rồi. Liverpool dưới thời Klopp xây dựng hệ thống pressing dựa trên phân tích PPDA (passes allowed per defensive action) — một chỉ số đo mức độ pressing hiệu quả. Bayer Leverkusen mùa 2023–2024 bất bại cả mùa giải Bundesliga không phải vì may mắn, mà vì Xabi Alonso và ban huấn luyện có một hệ thống dữ liệu chi tiết đến từng mét vuông sân. Đây không phải chuyện huyền bí. Đây là khoa học ứng dụng vào bóng đá.
Dự đoán bằng dữ liệu thì thực ra trông như thế nào?
Không phải cứ mở phần mềm lên là ra kết quả ngay đâu nhé. Dự đoán bằng dữ liệu là một quá trình — và nó bắt đầu từ việc chọn đúng chỉ số để nhìn vào.
Ví dụ, nếu bạn muốn đánh giá một đội có thực sự mạnh hay không, đừng chỉ nhìn vào bảng xếp hạng. Hãy xem xG của họ qua 10 trận gần nhất so với bàn thắng thực tế. Nếu đội đó thắng nhiều nhưng xG thấp hơn đối thủ liên tục, có khả năng họ đang được may mắn chống lưng — và sớm muộn gì kết quả cũng sẽ “trở về giá trị thực”. Ngược lại, đội thua nhiều nhưng xG cao là đội đang chơi tốt hơn điểm số phản ánh.
Một chỉ số khác khá thú vị là defensive line height — chiều cao của hàng thủ. Đội nào dâng cao thường chơi bóng pressing, nhưng cũng dễ bị khai thác bằng những đường chạy sau lưng. Biết điều này, bạn có thể đoán tại sao Erling Haaland lại phát huy tốt trước một số đội nhất định — không phải vì anh ta đột nhiên trở nên giỏi hơn, mà vì cái hàng thủ kia vừa đặt ra một bẫy hoàn hảo cho chân sút kiểu của anh.
Với World Cup 2026 đang đến gần — giải đấu sẽ mở rộng lên 48 đội chia thành 12 bảng, mỗi bảng 4 đội, khai mạc ngày 11/6/2026 trên đất Mỹ–Canada–Mexico — việc phân tích dữ liệu càng quan trọng hơn bao giờ hết. Nhiều đội lạ hơn, nhiều đối đầu ít thông tin lịch sử hơn, nhiều biến số hơn. Dữ liệu lúc này là thứ duy nhất giúp bạn bớt mù quáng. Bạn có thể tham khảo thêm về kèo, tỉ lệ và dự đoán các trận đấu tại đây để có thêm chi tiết trước khi tự rút ra phán đoán của mình.
Dữ liệu vẫn có giới hạn — và điều đó không nên khiến bạn nản
Sẽ không trung thực nếu tôi nói dữ liệu là vạn năng. Bóng đá vẫn có những thứ không thể số hóa được. Tâm lý phòng thay đồ trước trận chung kết. Quyết định lạ lùng của một HLV trong 5 phút cuối. Cầu thủ dự bị vào sân và ghi bàn vì một lý do hoàn toàn cảm xúc. Tất cả những điều đó vẫn tồn tại và vẫn ảnh hưởng đến kết quả.
Nhưng đó không phải lý do để từ bỏ dữ liệu. Đó là lý do để dùng nó đúng cách — như một công cụ hỗ trợ phán đoán, không phải như một cái máy thay thế tư duy. Biết đọc số liệu không làm bạn mất đi cái cảm giác rùng mình khi bàn thắng vào lưới. Nó chỉ giúp bạn hiểu tại sao bàn thắng đó xảy ra — và lần sau, có th