Dữ liệu mở: Không chỉ là vấn đề công nghệ

Dữ liệu mở: Không chỉ là vấn đề công nghệ
Dữ liệu mở hữu dụng với các cơ quan nhà nước cũng như công dân nhưng để thu được lợi ích từ nó, cần phải một cú chuyển lớn về cách nghĩ.

 


Một cú chụp màn hình GIS của thành phố Corona, California cho thấy sự tăng trưởng và phát triển của các dự án đang diễn ra ở khắp thành phố. 

Vào tháng 4/2016, khi Chris McMasters chuyển tới thành phố Corona, California để phụ trách văn phòng thông tin, ông ngạc nhiên thấy những người lãnh đạo thành phố rất ít khi dựa vào dữ liệu để ra quyết định. “Tôi đã quen điều hành công việc bằng việc sử dụng các bảng điều khiển và phân tích dữ liệu về những điều cơ bản hằng ngày. Đó là việc quá bình thường nhưng ở đây mọi người không làm như vậy, nó xa lạ với họ”. 

Do đó, McMasters đã liên hệ làm việc với trường Đại học Harvard, Trung tâm xuất sắc GovEx tại trường Đại học Johns Hopkins – nơi tập trung thúc đẩy việc sử dụng dữ liệu và bằng chứng thu thập được trong các thành phố có quy mô trung bình để hỗ trợ việc đưa ra chính sách của chính quyền thành phố thông qua sáng kiến What Works Cities. Kết quả là từ tháng 7/2018, thành phố Corona, đã mở một cổng dữ liệu mở để lưu trữ và trưng bày dữ liệu trực quan cho công chúng có thể truy cập. Được tập hợp từ nhiều nguồn khác nhau, trong đó có cả các biểu đồ về phân bổ ngân sách của thành phố, bản đồ GIS về quá trình sửa chữa đường xá…, dữ liệu hết sức phong phú và được bộ phận kỹ thuật “làm sạch” với những định dạng thống nhất để dễ dàng sử dụng, đặc biệt giới công chúng có thể coi đây là một phương pháp mang lại nhiều hiệu quả hơn mà các cơ quan từng áp dụng trước đây.

“Tôi nghĩ những người lãnh đạo chính phủ đang bắt đầu coi dữ liệu mở như một nguồn tài liệu thiết yếu hỗ trợ cho công việc họ đang làm và là công cụ hữu ích để tăng thêm lòng tin của công chúng với chính quyền… và cũng là một cơ hội để mở ra một cách tương tác khác với cử tri của mình mà có lẽ chưa từng có trước đây”, Andrew Nicklin, giám đốc phụ trách bộ phận thực hành dữ liệu tại GovEx nhận xét.
Việc mở kho dữ liệu để cho mọi người truy cập đem lại lợi ích cho chính các cơ quan của chính phủ. “Hiện tại, khi có một phòng ban nào tải thông tin lên kho dữ liệu này là các đơn vị khác cũng có thể lấy về để sử dụng”, Mark Balch, người phụ trách OpenGov, một trung tâm dữ liệu mở và cung cấp dịch vụ đám mây nhận xét. “Thay vì phải nhấc điện thoại lên và làm phiền ai đó phân tích dữ liệu thì họ có thể sử dụng ngay kho dữ liệu mở đó. Bằng cách ‘tự phục vụ', chính mình theo kiểu này, họ có thể nâng cao hiệu quả công việc và thời gian thực hiện”.

Dẫu sao, cần có những thay đổi về tư duy trên phạm vi lớn trước khi dữ liệu mở có thể thực sự trở thành công cụ phục vụ nhu cầu công việc của cả chính quyền lẫn người dân. Đây là một chặng đường nhiều thách thức vì những gì ngày nay chúng ta gọi là dữ liệu mở hoàn toàn khác với những gì chính phủ hình dung và thực hành về nó vào đầu thập kỷ này.

Minh bạch và công khai mới là sự khởi đầu

Về thực chất, nhiều kho dữ liệu mở xuất hiện trong vòng 5 năm trở lại đây xuất phát từ mong muốn minh bạch hóa các vấn đề quản lý, Mark Balch cho biết. Các trang web này liên quan đến chính quyền đơn giản là vì nó thu thập được nhiều dữ liệu công khai của các cơ quan chính phủ và sau đó là đăng tải nó trên một trang web để tiện tra cứu. Andrew Nicklin coi những nỗ lực sớm nhằm tạo ra các kho dữ liệu kiểu đó là “tự phát dữ liệu”. 

“Khi nhìn vào những kẻ đi tiên phong… có thể thấy những người phụ trách dữ liệu ở một số thành phố và nhìn rộng ra là một số quốc gia, công việc của họ đôi khi chỉ là công khai hóa dữ liệu. Thực chất đó là những gì họ đã làm”, Alan Shark, giám đốc điều hành của Viện nghiên cứu Công nghệ Công và là  phó giáo sư tại trường Đại học George Mason, nói. “Tôi ước có thể nói với họ ‘được thôi, vậy anh sẽ làm gì với dữ liệu này?’ Có thể họ nói 'ồ, đó không phải là quan tâm của chúng tôi’.” Câu nói của Alan Shark đã phản ánh thực chất những gì xảy ra với các kho báu mở ở thời điểm “bình minh của dữ liệu mở”.

Các kho dữ liệu kiểu này có thể đem lại những giá trị lớn cho những nhà nghiên cứu hiểu biết nhưng với phần lớn người dân khi truy cập vào đó, họ không biết là nó giúp ích gì được cho mình và mình có thể biết được gì từ đó. Vì vậy trong thời kỳ đầu, có những câu hỏi treo lơ lửng trên các kho dữ liệu mở là liệu tiện ích của chúng có vượt ra ngoài phạm vi công khai thông tin trên các trang web, Balch nhận xét.

May mắn là trong vài năm qua, các chính phủ bắt đầu nhận biết được giá trị của các kho dữ liệu mở với công việc điều hành ngân sách và hiệu suất quản lý. Dữ liệu mở cung cấp cho công chúng khía cạnh công khai ngân sách và quy trình tiến hành các hoạt động quản lý, qua đó giúp chính phủ có con đường ngắn hơn trong giao tiếp với công chúng, theo quan sát của Balch. Trao cho công chúng một cơ hội nhìn vào các mục tiêu định hình ngân sách chi tiêu hằng năm cũng như kết quả mà việc đầu tư này mang lại cho đất nước không chỉ làm minh bạch hóa hoạt động chi tiêu ngân sách mà còn giúp công chúng hiểu rõ hơn công việc của chính phủ. Rõ ràng điều đó cải thiện mối quan hệ giữa hai bên, điều không dễ thực hiện từ trước đến nay.

Tuy nhiên, dữ liệu mở tự thân nó không thể là mục tiêu cuối cùng của các sáng kiến về dữ liệu của chính phủ. Các chính phủ phải coi dữ liệu như một tài sản chiến lược, Nicklin nói, “dữ liệu mở là một công cụ giúp việc quản trị dữ liệu của chính phủ tốt hơn.”

Muốn làm được như vậy thì việc vượt qua những rắc rối ban đầu về công khai dữ liệu không phải là điểm kết thúc bởi sau khi thúc đẩy sự minh bạch và trao cho công chúng quyền truy cập dữ liệu thì “hành động thực sự là [chính phủ] ra quyết định dựa trên dữ liệu”, Shark nói. 

Chính niềm khao khát có được những quyết định quản lý dựa trên dữ liệu là những gì thúc đẩy thành phố Corona bắt đầu thực hiện từ sáng kiến về dữ liệu của mình.

Từ dữ liệu riêng lẻ thành kho dữ liệu chung 

“Khi các nhà quản lý thành phố Corona thuê tôi về làm việc, ý tưởng của họ ‘muốn có một thành phố được điều hành bằng dữ liệu, và muốn nó được mở và kết nối.’ Vì thế, đó là nhiệm vụ của tôi,” McMasters kể lại công việc khi anh bắt đầu tại Corona.

Khi đó, McMasters phát hiện ra đây là một thành phố với nhiều loại dữ liệu riêng rẽ. Mỗi cơ quan đều có một loại công việc của riêng mình, và mỗi cơ quan đều có những loại phần mềm thực hiện công việc. Và thách thức lớn nhất với thành phố này là sở hữu những bộ dữ liệu phức tạp từ các nguồn riêng rẽ và cần được tổng hợp, đồng bộ dữ liệu mới có thể dẫn đến khả năng ra các quyết định dựa trên dữ liệu. 


Briges và cộng sự mở các khóa tập huấn, thu hút cả những người bên ngoài các cơ quan chính quyền tham gia tạo ra đối thoại về dữ liệu ở cách tiếp cận khác.

Không riêng McMasters, Nicklin cũng cho rằng, việc phá vỡ các “lô cốt” dữ liệu như vậy là vô cùng quan trọng để có thể tạo được một kho dữ liệu phục vụ việc điều hành, quản lý thành phố. Nó không chỉ tạo ra một điểm đến cho những công dân quan tâm đến dữ liệu mà còn cho phép chính phủ tích hợp dữ liệu từ nhiều cơ quan quản lý, qua đó có được kho dữ liệu chiến lược.

Đó chính là cách Corona tiến hành để giải quyết vấn đề các “lô cốt” dữ liệu. Các viên chức của thành phố đã sử dụng giao diện lập trình ứng dụng (APIs) của chính phủ để trích rút thông tin từ các bộ dữ liệu phong phú của chính quyền thành phố, McMasters kể. Sau đó họ đưa dữ liệu đó vào các cơ sở dữ liệu được lưu trữ bằng công nghệ điện toán đám mây để cuối cùng tạo ra một hồ sơ dữ liệu chung, một nơi có chứa tất cả các dữ liệu cần thiết của thành phố. 

Dữ liệu được tái định vị bằng điện toán đám mây có thể lưu trữ được nhiều thông tin dữ liệu hơn và điều quan trọng là tạo khả năng truy cập cho mọi loại thiết bị, bất kể thời gian và địa điểm. “Tôi muốn một nơi có thể đưa ra quyết định dựa trên dữ liệu nhưng tôi cũng muốn dữ liệu có thể cung cấp thông tin online cho mọi công dân”, McMasters nói. “Đó là ý tưởng kép.”

Ngay cả khi đã loại bỏ các “lô cốt” dữ liệu số đóng và dữ liệu dưới dạng thực thể vật lý thì việc đem đến một văn hóa chia sẻ dữ liệu vẫn là một nội dung quan trọng cần thực hiện. “Văn hóa này rõ ràng là điều mấu chốt”, Balch nói. “Lúc nào anh cũng có thể thúc đẩy công nghệ nhưng nếu không có một thứ văn hóa sẵn sàng chấp nhận và tăng cường giá trị của công nghệ thì anh sẽ không thể gặt hái được gì nhiều.”
Việc thay đổi một thứ văn hóa đã tồn tại rất lâu trong các cơ quan chính quyền địa phương luôn đi kèm với những vấn đề của riêng nó.

Sốc văn hóa

Năm 2016, Little Rock, thủ phủ của Arkansas, trở thành thành phố đầu tiên của bang Arkansas thiết lập cổng dữ liệu mở.

Mặc dù cổng thông tin này được mở vào năm 2014, khi giám đốc IT của Little Rock theo đuổi việc mở một nền tảng dữ liệu mở để thúc đẩy minh bạch hóa dữ liệu với công chúng cũng như trong các cơ quan của thành phố. Melissa Bridges – điều phối viên Đổi mới sáng tạo và hiệu suất của thành phố, đã làm việc với các thành viên phụ trách IT của thành phố để nhanh chóng thiết lập một kho dữ liệu, đồng thời làm việc với các cơ quan chính quyền nhằm định hình những thông tin được đưa vào đó. Tuy vậy thành phố thiếu một cấu trúc quản trị để kết nối các cơ quan này. 

Năm 2015, Little Rock được chọn vào sáng kiến What Works Cities, qua đó, Bridges và cộng sự của bà đã làm việc với những người phụ trách các cơ quan về ý tưởng hợp tác trên dữ liệu đồng thời giải thích tại sao vấn đề đó lại quan trọng và vì sao nó có thể đem lại lợi ích cho công việc của họ. Bên cạnh đó, bà cũng giải thích với họ tầm quan trọng của việc xác định được các tiêu chuẩn về dữ liệu và sau đó mã hóa chúng thành các thủ tục hành chính trực tuyến và chính sách.

“Việc đưa mọi người ra khỏi lối suy nghĩ quen thuộc ‘tốt nhất là làm theo những gì chúng ta đã làm’ có lẽ là thách thức lớn nhất”, Bridges nhận xét. “Và việc trao đổi với các đồng nghiệp trên khắp thành phố để cùng làm việc này, tôi nghĩ cũng là vấn đề thách thức không kém.”

Dẫu vậy thì Bridges và cộng sự đã nhận ra một vấn đề: những người hằng ngày xử lý dữ liệu và cập nhật dữ liệu không hay biết về cổng dữ liệu mở của thành phố hay sáng kiến What Works City, đồng thời thiếu các điều phối viên dữ liệu ở các phòng ban trong thành phố. Do đó trong suốt một năm, Bridges và cộng sự đã làm việc với mọi người theo nhiều cách khác nhau để gắn kết với từng người phụ trách dữ liệu cấp phòng ban, hướng dẫn họ về tiêu chuẩn hóa dữ liệu, mở cả các khóa tập huấn cho nhân viên thành phố về nền tảng dữ liệu mở. Bà cũng thu hút cả những người bên ngoài các cơ quan chính quyền tham gia các khóa học để tạo ra đối thoại về dữ liệu ở cách tiếp cận khác.

Công chúng là một bên quan trọng trong việc kết nối với dữ liệu mở. Do đó, Little Rock đã thúc đẩy thói quen sử dụng dữ liệu mở của thành phố qua truyền thông xã hội, qua việc thông báo rộng rãi mỗi khi thành phố đưa ra được một bộ dữ liệu mới, hướng dẫn truy cập qua ứng dụng NextDoor và kết nối với các tổ chức cộng đồng, Bridges nói.

Kể lại câu chuyện 

Phải mất rất nhiều công sức để gắn kết và huấn luyện mọi người về dữ liệu, đặc biệt khi việc đó khiến họ nhận thức ra sự tồn tại và hữu dụng của nó. Với McMasters, xây dựng một câu chuyện về dữ liệu là vô cùng quan trọng để chứng tỏ vai trò của dữ liệu. “Dữ liệu thường kể một câu chuyện và việc tường thuật câu chuyện quan trọng vì nó góp phần bối cảnh hóa dữ liệu mà bạn thấy,” McMasters giải thích. “Còn tại sao dữ liệu quan trọng ư? Tại sao tôi phải quan tâm đến nó? Nguyên nhân là nếu chúng tôi chứng tỏ được điều đó thì nó cũng là cách chúng ta đánh giá chính mình và cách đưa ra quyết định.”

Nếu Little Rock đã thúc đẩy các dự án dữ liệu thông qua nhiều phương pháp khác nhau, bao gồm truyền thông xã hội, kết nối cộng đồng và thảo luận xã hội thì Corona làm được điều đó bằng việc “phá” các bộ dữ liệu hiện có thành những phần nhỏ hơn liên quan đến kế hoạch phát triển chiến lược của thành phố như an ninh, tài chính, phát triển kinh tế, McMasters nói. Các khu vực này đóng vai trò trung tâm và dữ liệu liên quan là đến các chủ đề đó cho thấy cách thành phố ra quyết định như thế nào và cách công dân đánh giá như thế nào về chính quyền.

Một cạm bẫy lớn là các chính quyền có thể mắc phải là cảm thấy các dữ liệu của mình cần phải hoàn hảo 100% khi tung ra, Nicklin nói và cho biết thêm, xu hướng này thay đổi khi ngày càng có nhiều chính quyền đưa ra các bộ dữ liệu mở cùng với nhận thức rằng nó vẫn có nhiều lỗi và khiếm khuyết. “Thay vì tìm cách phòng thủ, nên có cách nhìn nhận là dữ liệu của chúng tôi còn lộn xộn, còn thiếu hoàn hảo và công việc của bạn là cùng chúng tôi sửa chữa điều đó”, ông nói. 

Khi Little Rock mở nền tảng Citizen Connect vào năm 2017 như một công cụ kết nối công dân trực tuyến, thành phố chỉ có mỗi thông tin về an ninh được tải lên trên đó, Bridges kể. Các công chức thành phố biết rằng các bộ dữ liệu khác cần được “làm sạch” trước khi tải lên cổng dữ liệu mở và nỗ lực làm điều đó để cập nhật. Theo thời gian, Little Rock đã có thêm gấp ba dữ liệu.

Giống như các hình thức khác của đổi mới công nghệ, dữ liệu mở là một công cụ có tính tiến hóa. Những thay đổi trong văn hóa làm việc và công nghệ có thể gây nhụt chí bởi vì quá khó để áp dụng. Dẫu sao, quan trọng là giữ mục tiêu tiến về phía trước. “Giống như mọi người làm công việc này, chúng tôi đang cày xới một nền tảng mới và thay đổi từng ngày. Vì thế, để công việc tiếp tục tiến triển, chỉ cần giữ vững điều cốt lõi là làm việc thật tốt và hiểu rõ thách thức sẽ gặp”, Bridges đưa ra cách mà mình và cộng sự vượt qua khó khăn. □

Anh Vũ dịch
Nguồnhttps://www.americancityandcounty.com/2019/04/01/data-democratization/