Xử lý thông tin đầu vào - thách thức không nhỏ của công nghệ y tế

13:10' - 04/07/2020
Bnews Trong bối cảnh đại dịch COVID-19 vẫn diễn biến phức tạp, công nghệ chăm sóc sức khỏe đã thu hút nhiều sự chú ý.

Những cuộc thảo luận sôi nổi xung quanh việc phát triển các ứng dụng “theo dõi và truy vết” trên các thiết bị điện thoại thông minh (smartphone) là một minh chứng rõ nhất cho sự chú ý này.

Tuy nhiên, các nhà phát triển phần mềm ứng dụng, lập trình viên, kiến trúc sư hệ thống và quản trị viên cơ sở dữ liệu cho biết rất khó để xây dựng các ứng dụng này một cách hiệu quả, trừ khi ngành y tế có một cơ sở hạ tầng công nghệ đủ để hỗ trợ kho dữ liệu khổng lồ của mình.

Nói cách khác, các nhà phát triển cần nguồn thông tin đầu vào chất lượng cao, được phân tách rõ ràng và sắp xếp hợp lý.

Song chính việc nhập dữ liệu đầu vào (Data Ingestion) là một vấn đề mà ngành công nghệ y tế chưa thể tìm ra câu trả lời tối ưu.

Thế “khó” của ngành y tế

Data Ingestion chỉ quá trình kết nối, thu thập, sắp xếp, lưu trữ và kiểm soát luồng thông tin từ nhiều nguồn khác nhau vào một kho thống nhất để chúng có thể được sử dụng.

Trong ngành y tế, những thông tin này có thể đến từ các thử nghiệm nghiên cứu, từ các thiết bị y tế và hồ sơ trong bệnh viện, từ thiết bị đeo tay theo dõi sức khỏe cùng nhiều nguồn khác.

Tuy nghe có vẻ không quá khó khăn, song đây là một khối lượng công việc khổng lồ. Giám đốc phụ trách công nghệ chăm sóc sức khỏe và khoa học đời sống tại công ty chuyên về phân tích dữ liệu Databricks, ông Frank Nothaft, cho biết có ba thách thức mà ông phải đối mặt khi hợp tác với các công ty dược trong hoạt động này.

Chúng bao gồm lập kế hoạch cho khả năng mở rộng kho dữ liệu, nhu cầu chia sẻ dữ liệu có trách nhiệm, và cải thiện chất lượng dữ liệu bằng cách đưa các nhà khoa học tham gia quá trình nhập liệu.

Ông Nothaft cho biết các công ty dược phẩm đang đối mặt với một “cơn lũ” về dữ liệu. Những tiến bộ nhanh chóng về các công nghệ thu thập dữ liệu như các thiết bị hình ảnh kỹ thuật số và thiết bị công nghệ đeo trên người (wearable) đang chuyển một khối lượng dữ liệu khổng lồ và đa dạng vào tay các nhà nghiên cứu.

Chỉ tính riêng thông tin về xác định trình tự bộ gen đã được dự kiến sẽ tạo ra 40 exabyte (khoảng 40 tỷ GB) dữ liệu vào năm 2025.

Kiến trúc sư về hệ thống dữ liệu Matthew Braunschweig tại hệ thống quản lý thông tin y tế Meddbase lưu ý rằng kể cả với các ước tính dè dặt nhất, lượng dữ liệu về sức khỏe trên toàn cầu hiện vào khoảng 25.000 petabyte (khoảng 25 tỷ GB), với tốc độ tăng trưởng hàng năm là 36% đến năm 2025.

Theo ông Braunschweig, điều này khiến mối quan tâm về Dữ liệu lớn (Big Data) trong ngành chăm sóc sức khỏe ngày càng gia tăng.

Trừ khi mọi thứ được đưa vào một hệ thống duy nhất, các nhà phát triển sẽ phải tìm cách xử lý một khối lượng dữ liệu khổng lồ, bao gồm việc xây dựng dữ liệu, tiêu chuẩn hóa, khả năng tương tác, nhập và sàng lọc dữ liệu từ hàng ngàn nguồn tin khác nhau.

Thêm vào đó, ông Braunschweig nhắc rằng các dữ liệu từ các công ty dược phẩm có thêm một tầng khó khăn bởi lẽ chúng hiếm khi “đứng một mình”.

Điều này có nghĩa là nhà phát triển không chỉ phải biết về đơn thuốc mới của bệnh nhân, họ cũng cần hiểu tình trạng bệnh, chế độ ăn uống, tình trạng kinh tế của người bệnh.

Nếu các nhà phát triển còn muốn đi sâu theo dõi và cố gắng nhập dữ liệu về tình hình nhân khẩu học tại nơi bệnh nhân sinh sống (ví dụ về số quán đồ ăn nhanh hoặc mật độ tập trung của các cửa hàng rượu) thì họ sẽ nhanh chóng “mắc nghẹn” khi lượng dữ liệu đầu vào quá lớn.

Đối mặt với “biển” dữ liệu khổng lồ

Ông Nothaft lưu ý rằng vấn đề chia sẻ dữ liệu có trách nhiệm là một mối quan tâm lớn trong hoạt động xử lý dữ liệu y tế, nhưng lại chạy theo hai hướng khác nhau.

Ai cũng hiểu rằng việc các công ty dược phẩm lớn sử dụng thông tin bệnh nhân một cách an toàn và có trách nhiệm hay không là một vấn đề còn gây nhiều tranh cãi.

Tuy nhiên, các dữ liệu trên chỉ có thể mang tới lợi ích cho xã hội nếu các nhà nghiên cứu được quyền tiếp cận chúng để thu thập thông tin chuyên sâu.

Ông Nothaft giải thích rằng việc thành công ở cả hai mục tiêu này đòi hỏi các dữ liệu phải được đưa vào một trung tâm thống nhất, với yêu cầu kiểm soát quyền truy cập gắt gao.

Song chuyên gia của Databrick cũng nhấn mạnh rằng nếu việc nhập dữ liệu chỉ do các kỹ sư thực hiện mà không có bất kỳ đóng góp nào từ các nhà khoa học, chất lượng dữ liệu sẽ giảm.

Bằng cách đưa dữ liệu vào tay các nhà khoa học chuyên về sinh học và hóa học, các nhà phát triển công nghệ có thể sớm xác định được bất cứ vấn đề về chất lượng dữ liệu nào.

Tiến sĩ Ian Harrow, nhà tư vấn cho dự án khoa học đời sống The Pistoia Alliance, cho biết một thách thức khác đối với các công ty dược phẩm là họ không biết dữ liệu của mình được lưu trữ ở đâu.

Theo ông Harrow, nhiều nguồn dữ liệu là “di sản” được sinh ra từ các vụ mua bán hay sáp nhập chiến lược. Chúng đa số được lưu trữ ở các bộ phận khác nhau – như trên một máy tính xách tay trong phòng thí nghiệm, hoặc trong chiếc máy tính để bàn cá nhân của một nhà khoa học nào đó.

Thêm vào đó là các nguồn dữ liệu mới với tốc độ thu thập lớn như các thiết bị wearable, tất cả chúng đều trong các định dạng khác nhau và đều thiếu sự sắp xếp hợp lý.

Do vây, các công ty khó có thể truy xuất lượng dữ liệu trên và tái sử dụng chúng theo cách thức hữu hiệu. Chính điều này thường làm cho quá trình nhập dữ liệu trở nên khó khăn hơn.

Vấn đề trên là lý do tại sao Tiến sĩ Harrow và các đồng sự ủng hộ việc thiết lập các tiêu chuẩn dữ liệu cho toàn ngành y tế.

Ông cho rằng đây là một quy trình thiết yếu cần được tích hợp vào các hệ thống công nghệ thông tin mới - bao gồm nguyên tắc hướng dẫn FAIR (có thể tìm kiếm, có thể truy cập, có thể tương tác và tái sử dụng).

Nếu được áp dụng, các tiêu chuẩn này sẽ giúp cải thiện việc quản lý dữ liệu và giúp nâng cao tính hợp tác trong môi trường nghiên cứu.

Giống như những lĩnh vực khác của ngành công nghiệp phát triển phần mềm, mọi người  thường vẫn tập trung vào các ứng dụng, thiết bị, giao diện người dùng và khả năng tương tác của một ứng dung.

Nhưng những cơ sở hạ tầng cơ bản nhất cho việc thu nhập và quản lý dữ liệu mới là điều cho phép các nhà phát triển xây dựng một tương lai tươi sáng và lành mạnh hơn thông qua ứng dụng công nghệ cho mọi người./.

Tin liên quan


Tin cùng chuyên mục