Xử lý thông tin đầu vào - thách thức không nhỏ của công nghệ y tế
Những cuộc thảo luận sôi nổi xung quanh việc phát triển các ứng dụng “theo dõi và truy vết” trên các thiết bị điện thoại thông minh (smartphone) là một minh chứng rõ nhất cho sự chú ý này.
Tuy nhiên, các nhà phát triển phần mềm ứng dụng, lập trình viên, kiến trúc sư hệ thống và quản trị viên cơ sở dữ liệu cho biết rất khó để xây dựng các ứng dụng này một cách hiệu quả, trừ khi ngành y tế có một cơ sở hạ tầng công nghệ đủ để hỗ trợ kho dữ liệu khổng lồ của mình.
Nói cách khác, các nhà phát triển cần nguồn thông tin đầu vào chất lượng cao, được phân tách rõ ràng và sắp xếp hợp lý.
Song chính việc nhập dữ liệu đầu vào (Data Ingestion) là một vấn đề mà ngành công nghệ y tế chưa thể tìm ra câu trả lời tối ưu.
Thế “khó” của ngành y tế
Data Ingestion chỉ quá trình kết nối, thu thập, sắp xếp, lưu trữ và kiểm soát luồng thông tin từ nhiều nguồn khác nhau vào một kho thống nhất để chúng có thể được sử dụng.
Trong ngành y tế, những thông tin này có thể đến từ các thử nghiệm nghiên cứu, từ các thiết bị y tế và hồ sơ trong bệnh viện, từ thiết bị đeo tay theo dõi sức khỏe cùng nhiều nguồn khác.
Tuy nghe có vẻ không quá khó khăn, song đây là một khối lượng công việc khổng lồ. Giám đốc phụ trách công nghệ chăm sóc sức khỏe và khoa học đời sống tại công ty chuyên về phân tích dữ liệu Databricks, ông Frank Nothaft, cho biết có ba thách thức mà ông phải đối mặt khi hợp tác với các công ty dược trong hoạt động này.
Chúng bao gồm lập kế hoạch cho khả năng mở rộng kho dữ liệu, nhu cầu chia sẻ dữ liệu có trách nhiệm, và cải thiện chất lượng dữ liệu bằng cách đưa các nhà khoa học tham gia quá trình nhập liệu.
Ông Nothaft cho biết các công ty dược phẩm đang đối mặt với một “cơn lũ” về dữ liệu. Những tiến bộ nhanh chóng về các công nghệ thu thập dữ liệu như các thiết bị hình ảnh kỹ thuật số và thiết bị công nghệ đeo trên người (wearable) đang chuyển một khối lượng dữ liệu khổng lồ và đa dạng vào tay các nhà nghiên cứu.
Chỉ tính riêng thông tin về xác định trình tự bộ gen đã được dự kiến sẽ tạo ra 40 exabyte (khoảng 40 tỷ GB) dữ liệu vào năm 2025.
Kiến trúc sư về hệ thống dữ liệu Matthew Braunschweig tại hệ thống quản lý thông tin y tế Meddbase lưu ý rằng kể cả với các ước tính dè dặt nhất, lượng dữ liệu về sức khỏe trên toàn cầu hiện vào khoảng 25.000 petabyte (khoảng 25 tỷ GB), với tốc độ tăng trưởng hàng năm là 36% đến năm 2025.
Theo ông Braunschweig, điều này khiến mối quan tâm về Dữ liệu lớn (Big Data) trong ngành chăm sóc sức khỏe ngày càng gia tăng.
Trừ khi mọi thứ được đưa vào một hệ thống duy nhất, các nhà phát triển sẽ phải tìm cách xử lý một khối lượng dữ liệu khổng lồ, bao gồm việc xây dựng dữ liệu, tiêu chuẩn hóa, khả năng tương tác, nhập và sàng lọc dữ liệu từ hàng ngàn nguồn tin khác nhau.
Thêm vào đó, ông Braunschweig nhắc rằng các dữ liệu từ các công ty dược phẩm có thêm một tầng khó khăn bởi lẽ chúng hiếm khi “đứng một mình”.
Điều này có nghĩa là nhà phát triển không chỉ phải biết về đơn thuốc mới của bệnh nhân, họ cũng cần hiểu tình trạng bệnh, chế độ ăn uống, tình trạng kinh tế của người bệnh.
Nếu các nhà phát triển còn muốn đi sâu theo dõi và cố gắng nhập dữ liệu về tình hình nhân khẩu học tại nơi bệnh nhân sinh sống (ví dụ về số quán đồ ăn nhanh hoặc mật độ tập trung của các cửa hàng rượu) thì họ sẽ nhanh chóng “mắc nghẹn” khi lượng dữ liệu đầu vào quá lớn.
Đối mặt với “biển” dữ liệu khổng lồ
Ông Nothaft lưu ý rằng vấn đề chia sẻ dữ liệu có trách nhiệm là một mối quan tâm lớn trong hoạt động xử lý dữ liệu y tế, nhưng lại chạy theo hai hướng khác nhau.
Ai cũng hiểu rằng việc các công ty dược phẩm lớn sử dụng thông tin bệnh nhân một cách an toàn và có trách nhiệm hay không là một vấn đề còn gây nhiều tranh cãi.
Tuy nhiên, các dữ liệu trên chỉ có thể mang tới lợi ích cho xã hội nếu các nhà nghiên cứu được quyền tiếp cận chúng để thu thập thông tin chuyên sâu.
Ông Nothaft giải thích rằng việc thành công ở cả hai mục tiêu này đòi hỏi các dữ liệu phải được đưa vào một trung tâm thống nhất, với yêu cầu kiểm soát quyền truy cập gắt gao.
Song chuyên gia của Databrick cũng nhấn mạnh rằng nếu việc nhập dữ liệu chỉ do các kỹ sư thực hiện mà không có bất kỳ đóng góp nào từ các nhà khoa học, chất lượng dữ liệu sẽ giảm.
Bằng cách đưa dữ liệu vào tay các nhà khoa học chuyên về sinh học và hóa học, các nhà phát triển công nghệ có thể sớm xác định được bất cứ vấn đề về chất lượng dữ liệu nào.
Tiến sĩ Ian Harrow, nhà tư vấn cho dự án khoa học đời sống The Pistoia Alliance, cho biết một thách thức khác đối với các công ty dược phẩm là họ không biết dữ liệu của mình được lưu trữ ở đâu.
Theo ông Harrow, nhiều nguồn dữ liệu là “di sản” được sinh ra từ các vụ mua bán hay sáp nhập chiến lược. Chúng đa số được lưu trữ ở các bộ phận khác nhau – như trên một máy tính xách tay trong phòng thí nghiệm, hoặc trong chiếc máy tính để bàn cá nhân của một nhà khoa học nào đó.
Thêm vào đó là các nguồn dữ liệu mới với tốc độ thu thập lớn như các thiết bị wearable, tất cả chúng đều trong các định dạng khác nhau và đều thiếu sự sắp xếp hợp lý.
Do vây, các công ty khó có thể truy xuất lượng dữ liệu trên và tái sử dụng chúng theo cách thức hữu hiệu. Chính điều này thường làm cho quá trình nhập dữ liệu trở nên khó khăn hơn.
Vấn đề trên là lý do tại sao Tiến sĩ Harrow và các đồng sự ủng hộ việc thiết lập các tiêu chuẩn dữ liệu cho toàn ngành y tế.
Ông cho rằng đây là một quy trình thiết yếu cần được tích hợp vào các hệ thống công nghệ thông tin mới - bao gồm nguyên tắc hướng dẫn FAIR (có thể tìm kiếm, có thể truy cập, có thể tương tác và tái sử dụng).
Nếu được áp dụng, các tiêu chuẩn này sẽ giúp cải thiện việc quản lý dữ liệu và giúp nâng cao tính hợp tác trong môi trường nghiên cứu.
Giống như những lĩnh vực khác của ngành công nghiệp phát triển phần mềm, mọi người thường vẫn tập trung vào các ứng dụng, thiết bị, giao diện người dùng và khả năng tương tác của một ứng dung.
Nhưng những cơ sở hạ tầng cơ bản nhất cho việc thu nhập và quản lý dữ liệu mới là điều cho phép các nhà phát triển xây dựng một tương lai tươi sáng và lành mạnh hơn thông qua ứng dụng công nghệ cho mọi người./.
Tin liên quan
-
Công nghệ
EU quan ngại về ứng dụng truy vết tiếp xúc COVID-19 của Pháp
08:54' - 17/06/2020
Phó Chủ tịch Ủy ban châu Âu Margrethe Vestager cho biết ứng dụng truy vết tiếp xúc của Pháp có thể không kết nối với ứng dụng của các nước khác thuộc EU vì cách lưu trữ dữ liệu.
-
Công nghệ
Đức công bố triển khai ứng dụng truy vết tiếp xúc
07:56' - 15/06/2020
Bộ trưởng Y tế liên bang Đức Jens Spahn ngày 14/6 cho biết, ứng dụng trên điện thoại di động để truy vết tiếp xúc của người nhiễm virus SARS-CoV-2 ở Đức sẽ được đưa vào vận hành bắt đầu từ tuần này.
Tin cùng chuyên mục
-
Công nghệ
Spotify sẽ cho phép người dùng cá nhân hóa danh sách phát nhạc
07:30'
Spotify đã định hình lại cách mọi người nghe nhạc trong một thế giới đa âm sắc, mang lại những cảm xúc và trải nghiệm chưa từng có.
-
Công nghệ
Google tham gia lĩnh vực điện nhiệt hạch
13:30' - 01/07/2025
Google đã công bố kế hoạch mua 200 megawatt điện nhiệt hạch sạch từ nhà máy điện nhiệt hạch quy mô lưới điện đầu tiên trên thế giới, được gọi là ARC, có trụ sở tại Chesterfield, Virginia (Mỹ).
-
Công nghệ
Cuộc đua không đích đến của Netflix
07:30' - 01/07/2025
Công ty truyền phát trực tuyến Netflix đang phát triển công nghệ có thể giúp cá nhân hóa không chỉ các đề xuất người dùng thấy trên dịch vụ mà còn cả những video.
-
Công nghệ
Trợ lý ảo cán bộ công chức- Giải pháp tra cứu thẩm quyền tức thì cho chính quyền 2 cấp
19:35' - 30/06/2025
Trợ lý ảo cán bộ công chức hỗ trợ giải đáp thắc mắc về phân quyền, phân cấp và phân định thẩm quyền giữa Chính phủ và chính quyền 2 cấp.
-
Công nghệ
Chiết xuất vàng bền vững từ rác thải điện tử
18:02' - 30/06/2025
Một nhóm nhà khoa học tại Đại học Flinders (Australia) vừa công bố phương pháp mới chiết xuất vàng từ quặng và rác thải điện tử mà không cần đến những hóa chất độc hại như xyanua hay thủy ngân.
-
Công nghệ
Phụ nữ dân tộc thiểu số thích ứng với công nghệ số
13:30' - 30/06/2025
Việc người dân tộc thiểu số tiếp cận với điện thoại thông minh, Internet và mạng xã hội không chỉ là một thay đổi công nghệ đơn thuần, mà là sự khởi đầu cho nhiều chuyển biến xã hội sâu sắc.
-
Công nghệ
Vĩnh Long nâng cao kỹ năng về ứng dụng AI và công vụ số cho cán bộ, công chức
08:00' - 30/06/2025
Ngày 28/6, Sở Khoa học và Công nghệ tỉnh Vĩnh Long tổ chức hội nghị tập huấn Bình dân học vụ số với chủ đề “Ứng dụng AI dành cho cán bộ, công chức và viên chức tỉnh Vĩnh Long” năm 2025.
-
Công nghệ
CT Group ra mắt bản thiết kế chip IoT của kỹ sư Việt
20:41' - 29/06/2025
Chiều 29/6 tại TP. Hồ Chí Minh, Tập đoàn CT Group tổ chức ra mắt thiết kế chip IoT của người Việt, do các kỹ sư của Tập đoàn thiết kế toàn diện với công nghệ thiết kế chip bán dẫn CMOS và III/V Semi.
-
Công nghệ
Ngành hàng không rơi vào tầm ngắm của nhóm tin tặc nguy hiểm
16:23' - 29/06/2025
Hai “gã khổng lồ” công nghệ Google và Palo Alto Networks đang gióng lên hồi chuông cảnh báo về việc nhóm tin tặc có tên Scattered Spider đang chuyển hướng quan tâm sang ngành hàng không.