Xử lý thông tin đầu vào - thách thức không nhỏ của công nghệ y tế
Những cuộc thảo luận sôi nổi xung quanh việc phát triển các ứng dụng “theo dõi và truy vết” trên các thiết bị điện thoại thông minh (smartphone) là một minh chứng rõ nhất cho sự chú ý này.
Tuy nhiên, các nhà phát triển phần mềm ứng dụng, lập trình viên, kiến trúc sư hệ thống và quản trị viên cơ sở dữ liệu cho biết rất khó để xây dựng các ứng dụng này một cách hiệu quả, trừ khi ngành y tế có một cơ sở hạ tầng công nghệ đủ để hỗ trợ kho dữ liệu khổng lồ của mình.
Nói cách khác, các nhà phát triển cần nguồn thông tin đầu vào chất lượng cao, được phân tách rõ ràng và sắp xếp hợp lý.
Song chính việc nhập dữ liệu đầu vào (Data Ingestion) là một vấn đề mà ngành công nghệ y tế chưa thể tìm ra câu trả lời tối ưu.
Thế “khó” của ngành y tế
Data Ingestion chỉ quá trình kết nối, thu thập, sắp xếp, lưu trữ và kiểm soát luồng thông tin từ nhiều nguồn khác nhau vào một kho thống nhất để chúng có thể được sử dụng.
Trong ngành y tế, những thông tin này có thể đến từ các thử nghiệm nghiên cứu, từ các thiết bị y tế và hồ sơ trong bệnh viện, từ thiết bị đeo tay theo dõi sức khỏe cùng nhiều nguồn khác.
Tuy nghe có vẻ không quá khó khăn, song đây là một khối lượng công việc khổng lồ. Giám đốc phụ trách công nghệ chăm sóc sức khỏe và khoa học đời sống tại công ty chuyên về phân tích dữ liệu Databricks, ông Frank Nothaft, cho biết có ba thách thức mà ông phải đối mặt khi hợp tác với các công ty dược trong hoạt động này.
Chúng bao gồm lập kế hoạch cho khả năng mở rộng kho dữ liệu, nhu cầu chia sẻ dữ liệu có trách nhiệm, và cải thiện chất lượng dữ liệu bằng cách đưa các nhà khoa học tham gia quá trình nhập liệu.
Ông Nothaft cho biết các công ty dược phẩm đang đối mặt với một “cơn lũ” về dữ liệu. Những tiến bộ nhanh chóng về các công nghệ thu thập dữ liệu như các thiết bị hình ảnh kỹ thuật số và thiết bị công nghệ đeo trên người (wearable) đang chuyển một khối lượng dữ liệu khổng lồ và đa dạng vào tay các nhà nghiên cứu.
Chỉ tính riêng thông tin về xác định trình tự bộ gen đã được dự kiến sẽ tạo ra 40 exabyte (khoảng 40 tỷ GB) dữ liệu vào năm 2025.
Kiến trúc sư về hệ thống dữ liệu Matthew Braunschweig tại hệ thống quản lý thông tin y tế Meddbase lưu ý rằng kể cả với các ước tính dè dặt nhất, lượng dữ liệu về sức khỏe trên toàn cầu hiện vào khoảng 25.000 petabyte (khoảng 25 tỷ GB), với tốc độ tăng trưởng hàng năm là 36% đến năm 2025.
Theo ông Braunschweig, điều này khiến mối quan tâm về Dữ liệu lớn (Big Data) trong ngành chăm sóc sức khỏe ngày càng gia tăng.
Trừ khi mọi thứ được đưa vào một hệ thống duy nhất, các nhà phát triển sẽ phải tìm cách xử lý một khối lượng dữ liệu khổng lồ, bao gồm việc xây dựng dữ liệu, tiêu chuẩn hóa, khả năng tương tác, nhập và sàng lọc dữ liệu từ hàng ngàn nguồn tin khác nhau.
Thêm vào đó, ông Braunschweig nhắc rằng các dữ liệu từ các công ty dược phẩm có thêm một tầng khó khăn bởi lẽ chúng hiếm khi “đứng một mình”.
Điều này có nghĩa là nhà phát triển không chỉ phải biết về đơn thuốc mới của bệnh nhân, họ cũng cần hiểu tình trạng bệnh, chế độ ăn uống, tình trạng kinh tế của người bệnh.
Nếu các nhà phát triển còn muốn đi sâu theo dõi và cố gắng nhập dữ liệu về tình hình nhân khẩu học tại nơi bệnh nhân sinh sống (ví dụ về số quán đồ ăn nhanh hoặc mật độ tập trung của các cửa hàng rượu) thì họ sẽ nhanh chóng “mắc nghẹn” khi lượng dữ liệu đầu vào quá lớn.
Đối mặt với “biển” dữ liệu khổng lồ
Ông Nothaft lưu ý rằng vấn đề chia sẻ dữ liệu có trách nhiệm là một mối quan tâm lớn trong hoạt động xử lý dữ liệu y tế, nhưng lại chạy theo hai hướng khác nhau.
Ai cũng hiểu rằng việc các công ty dược phẩm lớn sử dụng thông tin bệnh nhân một cách an toàn và có trách nhiệm hay không là một vấn đề còn gây nhiều tranh cãi.
Tuy nhiên, các dữ liệu trên chỉ có thể mang tới lợi ích cho xã hội nếu các nhà nghiên cứu được quyền tiếp cận chúng để thu thập thông tin chuyên sâu.
Ông Nothaft giải thích rằng việc thành công ở cả hai mục tiêu này đòi hỏi các dữ liệu phải được đưa vào một trung tâm thống nhất, với yêu cầu kiểm soát quyền truy cập gắt gao.
Song chuyên gia của Databrick cũng nhấn mạnh rằng nếu việc nhập dữ liệu chỉ do các kỹ sư thực hiện mà không có bất kỳ đóng góp nào từ các nhà khoa học, chất lượng dữ liệu sẽ giảm.
Bằng cách đưa dữ liệu vào tay các nhà khoa học chuyên về sinh học và hóa học, các nhà phát triển công nghệ có thể sớm xác định được bất cứ vấn đề về chất lượng dữ liệu nào.
Tiến sĩ Ian Harrow, nhà tư vấn cho dự án khoa học đời sống The Pistoia Alliance, cho biết một thách thức khác đối với các công ty dược phẩm là họ không biết dữ liệu của mình được lưu trữ ở đâu.
Theo ông Harrow, nhiều nguồn dữ liệu là “di sản” được sinh ra từ các vụ mua bán hay sáp nhập chiến lược. Chúng đa số được lưu trữ ở các bộ phận khác nhau – như trên một máy tính xách tay trong phòng thí nghiệm, hoặc trong chiếc máy tính để bàn cá nhân của một nhà khoa học nào đó.
Thêm vào đó là các nguồn dữ liệu mới với tốc độ thu thập lớn như các thiết bị wearable, tất cả chúng đều trong các định dạng khác nhau và đều thiếu sự sắp xếp hợp lý.
Do vây, các công ty khó có thể truy xuất lượng dữ liệu trên và tái sử dụng chúng theo cách thức hữu hiệu. Chính điều này thường làm cho quá trình nhập dữ liệu trở nên khó khăn hơn.
Vấn đề trên là lý do tại sao Tiến sĩ Harrow và các đồng sự ủng hộ việc thiết lập các tiêu chuẩn dữ liệu cho toàn ngành y tế.
Ông cho rằng đây là một quy trình thiết yếu cần được tích hợp vào các hệ thống công nghệ thông tin mới - bao gồm nguyên tắc hướng dẫn FAIR (có thể tìm kiếm, có thể truy cập, có thể tương tác và tái sử dụng).
Nếu được áp dụng, các tiêu chuẩn này sẽ giúp cải thiện việc quản lý dữ liệu và giúp nâng cao tính hợp tác trong môi trường nghiên cứu.
Giống như những lĩnh vực khác của ngành công nghiệp phát triển phần mềm, mọi người thường vẫn tập trung vào các ứng dụng, thiết bị, giao diện người dùng và khả năng tương tác của một ứng dung.
Nhưng những cơ sở hạ tầng cơ bản nhất cho việc thu nhập và quản lý dữ liệu mới là điều cho phép các nhà phát triển xây dựng một tương lai tươi sáng và lành mạnh hơn thông qua ứng dụng công nghệ cho mọi người./.
Tin liên quan
-
Công nghệ
EU quan ngại về ứng dụng truy vết tiếp xúc COVID-19 của Pháp
08:54' - 17/06/2020
Phó Chủ tịch Ủy ban châu Âu Margrethe Vestager cho biết ứng dụng truy vết tiếp xúc của Pháp có thể không kết nối với ứng dụng của các nước khác thuộc EU vì cách lưu trữ dữ liệu.
-
Công nghệ
Đức công bố triển khai ứng dụng truy vết tiếp xúc
07:56' - 15/06/2020
Bộ trưởng Y tế liên bang Đức Jens Spahn ngày 14/6 cho biết, ứng dụng trên điện thoại di động để truy vết tiếp xúc của người nhiễm virus SARS-CoV-2 ở Đức sẽ được đưa vào vận hành bắt đầu từ tuần này.
Tin cùng chuyên mục
-
Công nghệ
Spotify cho phép người dùng miễn phí chọn và phát nhạc
13:30' - 16/09/2025
Spotify cho biết các tính năng mới sẽ được triển khai trên toàn cầu cho người dùng miễn phí, nhưng vẫn sẽ có một số hạn chế mà người dùng Premium sẽ không gặp phải.
-
Công nghệ
Ngành công nghiệp robot hình người chờ đợi khoảng khắc ChatGPT
07:30' - 16/09/2025
Robot hình người là những cỗ máy được hỗ trợ bởi trí tuệ nhân tạo (AI), được thiết kế để giống con người về ngoại hình và chuyển động.
-
Công nghệ
Cuộc chiến smartphone cao cấp nóng lên: Xiaomi tung "vũ khí" mới thách thức Apple
17:56' - 15/09/2025
Tập đoàn Xiaomi sẽ ra mắt mẫu điện thoại thông minh cao cấp thế hệ mới ngay trong tháng này, cạnh tranh trực diện với Apple Inc. để giành thị phần trong phân khúc điện thoại thông minh cao cấp.
-
Công nghệ
Châu Phi và tham vọng phát triển năng lượng từ hydro xanh
16:00' - 15/09/2025
Sản xuất hydro sạch không còn được xem là dự án xa vời.
-
Công nghệ
Tăng cường nhân lực cho cấp xã, thúc đẩy chuyển đổi số
07:30' - 15/09/2025
Việc ứng dụng công nghệ thông tin, số hóa dữ liệu và cải cách thủ tục hành chính cũng là giải pháp quan trọng để nâng cao hiệu quả hoạt động, giúp bộ máy tinh gọn nhưng vẫn đảm bảo chất lượng phục vụ.
-
Công nghệ
Thái Lan - thị trường phát triển hàng đầu Đông Nam Á về trí tuệ nhân tạo
15:37' - 14/09/2025
Thái Lan đã nổi lên như một trong những thị trường phát triển nhanh nhất Đông Nam Á về trí tuệ nhân tạo (AI) với số lượng người dùng ChatGPT hoạt động hàng tuần đã tăng gấp 4 lần trong năm qua.
-
Công nghệ
Amazon tham gia đường đua robotaxi
13:30' - 14/09/2025
Amazon đang tham gia một thị trường hướng đến tương lai trong bối cảnh Waymo lại có lợi thế lớn khi đã cung cấp dịch vụ xe tự lái thương mại từ năm 2020.
-
Công nghệ
SK hynix phát triển HBM4 đầu tiên trên thế giới
07:30' - 14/09/2025
SK hynix ngày 12/9 cho biết đã hoàn tất phát triển chip HBM4 đầu tiên trên thế giới dành cho hệ thống trí tuệ nhân tạo và sẵn sàng bước vào giai đoạn sản xuất hàng loạt.
-
Công nghệ
Giữ gìn, lan tỏa nét đẹp nghề dệt thổ cẩm qua nền tảng số
13:30' - 13/09/2025
Nghề dệt thổ cẩm của người M’nông ở tỉnh Đồng Nai đã được công nhận là Di sản Văn hóa phi vật thể quốc gia, tuy nhiên hành trình bảo tồn, phát huy nét đẹp di sản này vẫn còn nhiều chông gai.