Tầm quan trọng của dữ liệu giao dịch tại Việt Nam
Tại thị trường chứng khoán phái sinh Việt Nam, dữ liệu thu thập từ nguồn API, bảng điện hay các bên cung cấp dữ liệu đều không phải là dữ liệu khớp lệnh thực tế.
Bảng 05 dưới đây là ví dụ nguồn dữ liệu trả về hợp đồng VN- 30F1M vào lúc 11:29:58 khớp 820 hợp đồng ở giá 1082. Dữ liệu này có thể được hiểu là vào khoảng 11:29:58 có 820 hợp đồng khớp lệnh ở vùng 1082. Khi thị trường ít dao động, độ sai lệch quanh giá trị trả về thường ở mức 0.3 điểm, tuy nhiên, vào những lúc thị trường biến động mạnh thì độ sai lệch có thể lên đến vài điểm. Trong trường hợp “call margin” độ sai lệch trả về có thể lên tới 30 – 40 điểm.
Nguyên nhân sai lệch là do hiện tượng “gộp tick” – cộng dồn nhiều tick trong một khoảng thời gian và trả về một tick tượng trưng duy nhất. Tại Việt Nam, thời gian gộp tick thường rơi vào khoảng 02 giây. Dữ liệu trả về cũng có thể bị chậm nhiều phút hoặc thậm chí không có dữ liệu trong một khoảng thời gian, vì các lý do thường không được công bố. Điều này có nghĩa là, dù tiếp cận được nguồn dữ liệu tốt nhất Việt Nam chăng nữa thì dữ liệu vẫn có sai lệch so với thực tế. Do đó, nhà giao dịch có thể cân nhắc sử dụng dữ liệu giao dịch sinh ra bởi thuật toán để thu thập dữ liệu ẩn với độ chính xác tuyệt đối.
Điều kiện để thu thập dữ liệu giao dịch
Điều kiện cần là hệ thống giao dịch thuật toán tần suất cao, qua đó dữ liệu trả về liên tục đủ để phản ánh được thị trường chung, đặc biệt là các thời điểm nhạy cảm khi giá khớp lệnh thực tế và giá giả định chênh lệch nhiều.
Điều kiện đủ là hệ thống phải có đủ nhiều thuật toán. Sự đa dạng thuật toán sẽ tổng hợp ra một bức tranh tổng quan thị trường, qua đó phát hiện điều kiện thị trường thuận lợi cho mỗi thuật toán và ngược lại. Hơn nữa, các thuật toán giao dịch cần có sự đa dạng về chiến lược để tránh thu thập cùng một loại dữ liệu. Nhiều chiến lược giao dịch khác nhau với các loại lệnh khác nhau sẽ giúp dữ liệu giao dịch thêm phong phú. Điển hình là chiến lược quán tính giá sẽ cho dữ liệu khớp lệnh thị trường trong khi chiến lược tạo lập thị trường sẽ cho dữ liệu khớp lệnh giới hạn.
Ứng dụng thực tiễn
Ứng dụng đầu tiên của dữ liệu khớp lệnh là để ước lượng mức độ trượt giá của thị trường. Từ dữ liệu của hàng ngàn lần khớp lệnh, sẽ tính toán được trượt giá với độ tin cậy cao. Qua đó, tăng độ tin cậy của giai đoạn kiểm thử dữ liệu quá khứ và kiểm thử giao dịch trên giấy. Cần chú ý thời điểm trượt giá cao thường gây bất lợi cho thuật toán sử dụng lệnh thị trường, nhưng lại là lợi thế cho thuật toán sử dụng lệnh giới hạn.
Theo đó, thống kê được các thời điểm “nhạy cảm” của thị trường khi mà các thuật toán vận hành với tốc độ hoàn toàn khác biệt so với trung bình. Ở thời điểm “nhạy cảm” tần suất giao dịch có thể gấp 10 lần so với bình thường. Bất cứ cải thiện nào tại thời điểm này cũng đem lại kết quả vượt trội cho hệ thống giao dịch tự động.
Một ứng dụng quan trọng khác của dữ liệu khớp lệnh là cho phép hình thành kỳ vọng về thị trường, qua đó tối ưu hiệu quả phân bổ vốn cho các nhóm chiến lược khác nhau, điển hình là nhóm chiến lược quán tính giá và nhóm chiến lược hồi quy trung vị.
Cuối cùng là khả năng nắm bắt được các giao dịch bất thường trên thị trường, qua đó có lợi thế nhất định khi vận hành hệ thống. Nguyên tắc của hướng tiếp cận này là, nếu một sự kiện bất thường diễn ra liên tục thì rất có thể đó là tín hiệu quan trọng không thể bỏ qua.
Kết hợp dữ liệu thị trường và dữ liệu giao dịch thuật toán đã giúp ALGOTRADE thích nghi tốt hơn trong nhiềuhoàn cảnh. Điển hình nhất là hệ thống vẫn vận hành ổn định trong điều kiện bảng điện và các nguồn dữ liệu thị trường trên toàn Việt Nam không còn hoạt động vì dòng tiền tăng đột biến trong giai đoạn Covid.