태그 : dataportability

Google, 데이터 해방 프로토콜 공개

얼마전 포스트에서 Google의 데이터 해방 전선(Data Liberation Front)에 대해 소개했습니다. 아직 Google의 모든 서비스들이 데이터 이동성을 지원하는 것은 아니었는데, 몇 시간 전에 공개된 데이터 해방 프로토콜을 통해 모든 Google 서비스의 데이터를 import/export 할 수 있게 되었다고 합니다.

Google Site Data API 랩(http://code.google.com/intl/ko-KR/apis/sites/)의 설명에 따르면, 해당 API로 아래 기능을 사용할 수 있습니다.
  • 페이지, 코멘트, 첨부파일, 기타 다른 컨텐츠의 추출, 생성, 수정, 이동, 삭제
  • 사이트의 변경 기록(revision history) 검토
  • 사이트의 모든 추가, 수정, 삭제 동작 모니터링
  • 첨부파일 업로드/다운로드
  • 사이트의 사용자를 위해 커스터마이징 된 개짓(gadget) 생성
데이터 해방 프로토콜은 http://code.google.com/p/google-sites-liberation/ 에서 구할 수 있습니다. java 용으로 개발된 듯, jar 파일과 소스, 사용자 설명서가 공개되어 있습니다. 소개에 따르면 사용자 인증을 거친 뒤에, XTML 형식의 데이터를 import/export 시킬 수 있습니다. 샘플 코드는 http://code.google.com/intl/ko-KR/apis/sites/code.html 에서 구할 수 있습니다.

This is an import/export tool for Google Sites. Using HTML Microformatsit generates an XHTML version of Sites content suitable for offlinebrowsing and simple HTTP hosting, which is also able to be losslesslyimported back into sites.


왜 Google은 자사의 데이터를 오픈시키는 것일까요? kay님의 질문에 대한 저의 답은 '플랫폼 호환성'이었습니다. xml로 된 atom 형식과 HTTP GET, POST는 어떤 OS, 언어에도 쉽게 적용할 수 있는 프로토콜이며 파일 포맷입니다. 웹을 플랫폼으로 생각하는 Google의 입장으로는 이 포맷을 지원하여 데이터를 오픈시키는 것이 상대방을 압박할 수 있습니다. 일부 사용자는 Google에서 다른 서비스로 옮겨갈지 모르겠지만, 대다수는 Google에 남거나 옮겨올것입니다. 서비스에 대한 자신감, 그리고 자신들의 비전(Don't be Evil)을 유지하면서 웹 플랫폼이라는 지향점을 향하는 Google의 모습이 인상적입니다.

by S_H_Kim | 2009/09/26 23:40 | 기타 ID 동향 | 트랙백(1) | 핑백(1) | 덧글(2)

Google의 데이터 해방전선(Data Liberation Front) 프로젝트

내가 가입한 사이트에 저장된 개인정보, 사이트에 활동하면서 쌓인 정보들(ex. UCC, 글, 활동 기록)은 누구의 소유일까요? 사이트 입장에서는 무료로 서비스를 제공해주었으니 그 데이터는 사이트 소유라고 주장할 것입니다. 반대로 사용자는 자신이 생성한 데이터이므로 당연히 사용자 소유라고 주장할 수 있습니다.

새로운 서비스를 제공하는 사이트가 많아질수록 사용자는 더 나은 서비스를 향해 이동하려하지만, 사이트에 축적된 사용자 데이터가 방대해 질 수록 다른 사이트로 옮기기 어려워집니다. 다른 사이트로 잘 가라고 데이터를 포장해주는 사이트는 없기 때문입니다.

그래도 사용자들은 다른 사이트로 옮기면서 데이터를 가지고 가려고 스크립트를 짜거나 copy&paste 하는 등 여러가지 편법을 쓰려고 합니다. 데이터 이동성(Data Portability) 프로젝트는 바로 이런 사용자의 욕구를 채워주기 위한 서비스를 지향하는데, 대다수는 소규모 사이트이나 Google, Facebook 같은 큰 사이트도 가입했었습니다.

Google은 이미 2008년 1월 데이터 이동성 프로젝트에 참여하였고 OpenSocial이라는 사이트 독립적인 어플리케이션 개발 플랫폼을 제시하였습니다. OpenSocial은 해외에서 Google, Facebook, MySpace, 국내에는 Daum, Paran 등이 사용중 도입을 발표했습니다. 네이트에서 30일 오픈소셜을 적용한 앱스토어를 오픈할 예정이고, Naver 또한 이번 Deview 2009에서 오픈소셜을 적용하기로 결정했습니다.



그러나 Google은 데이터 이동성 프로젝트의 진행과는 무관하게 독자적으로 진행하고 있었습니다. 처음부터 데이터 이동성 프로젝트는 '대인배'나 할 법한 일인데도, Facebook 같이 독자적인 플랫폼을 밀고 있는 업체가 끼어서 생색만 내고 있습니다. 데이터 이동성 프로젝트 또한 실제적인 스펙이나 Best Practice를 제시하기 보다는 메인이 아닌 일들을 처리하는 Working Group만 만들고 진행하고 있습니다.

Data portability on the social web is enough of a conundrum that it has its own open workgroup,which, unfortunately, despite having good intentions, has not thus farmanaged to produce a consensus among its members (which include Google, Facebook and other big name social web services).[1]

그래서 Google은 2006년부터 자사의 제품에 대해서 데이터 이동성을 제공하려는 작업을 진행하고 있습니다. 현재 2/3 정도 제품들에 대해 진행이 완료되었다고 합니다. 왜 이전에는 몰랐을까요..

Are you done?  Are all of Google's products liberated?

No.  While users can get data out of our products one way or another, we're about two thirds of the way through and we continue to work to make it easier to get data in and out of our products. [2]

별도의 컨소시엄을 구성할 생각은 없지만, 타 기업을 배제할 생각도 없습니다. Google의 각 제품에 대해 개별적인 방법을 취하는 것 같은데, 컨소시엄을 구성한다고 해서 하나의 스펙을 만들 수 있을지 의문입니다. 역시, 새로운 표준이나 데이터 포맷을 만들 계획은 없다고 합니다. 하지만 방법론이나 Best Practice를 공유하는 정도는 가능할 것 같군요.

Are you trying to start a consortium?

No, but we'd be thrilled if other companies followed our lead.[2]

Are you creating new standards and formats for data?

No. We're working to use existing open standards formats wherever possible,and to document how we use those formats in a clear simple manner.[2]

Naver는 며칠전 열린 Deview 2009에서 OpenSocial을 채택하고 서비스를 개방하겠다고 발표했습니다. 단순히 생색을 내고 최대한 자신들의 이익을 위해 데이터이동성 개념을 사용하는 Facebook 같이 될 것인지, Google 처럼 자사의 서비스마다 실제로 데이터 이동성을 지원할지 궁금합니다. 저는 전자를 예상하지만, 그 예상이 틀리길 바랍니다.

레퍼런스
[1] http://www.webmonkey.com/blog/Google_s__Data_Liberation_Front__Aims_to_Make_Your_Data_Portable
[2] http://www.dataliberation.org/home/faq

by S_H_Kim | 2009/09/21 22:35 | 소셜네트워크 | 트랙백(1) | 핑백(1) | 덧글(2)

미국 정부. Gov 2.0에 OpenID와 Information Card(aka. CardSpace) 채택

현재 문제

현재 미국 정부는 500개가 넘는 웹 사이트를 운영중이며, 그 중에 1/3은 독자적인 id/pw 체계를 가지고 있습니다. 즉, 미국 정부의 웹사이트를 제대로 이용하려면 약 170개 이상의 id/pw를 만들어야 한다는 것이죠. 또한 똑같은 개인정보가 흩어져 있지만, 이를 누가 제대로 관리하는지는 아무도 모릅니다. 우리나라의 사례를 살펴봐도 웹사이트의 보안성 평가를 수행할 때마다 정부기관의 웹사이트가 가장 취약하다는 결론을 매번 보게 됩니다. 우리나라도 미국과 별반 차이가 없죠.

Today there are over 500 government websites and about 1/3 of them require a user name and password. Users need to be able to register and save information and preferences on government websites the same way they do today with their favorite consumer sites, but without revealing any personally identifiable information to the government.[3]

가능한 해결책

이는 전통적인 id 관리 문제입니다. id/pw를 독자적으로 유지하는 기존의 silo 방식은 centralized, federated, user-centric 방식으로 대체될 수 있습니다. centralized는 간단하고 신뢰있지만 SPF(Single Point of Failer)문제가 있고, federated 방식은 기관간의 agreement 및 확장 문제, user-centric은 신뢰/보안 문제가 있습니다. 용도에 따라 각각의 장단점이 있기 때문에 어느 방식이 가장 좋다고는 말할 수 없습니다.

The challenge is that supporting this kind of citizen interaction with government via the web means that identity needs to be solved. On the one hand you can’t just ask citizens to get a new user-name and password for all the websites across dozens of agencies that they log into. On the other you also can’t have one universal ID that the government issues to you and works across all government sites.Citizens need a way to interact with their government pseudononymously& in the future in verified ways.[6]

미국 정부의 user-centric 모델 선택

미국 정부는 user-centric 모델을 사용하기로 했습니다. 이번주에 열린 Gov 2.0 Summit에서 미국 정부 웹사이트는 OpenID와 InfoCard를 지원하는 파일럿 프로그램을 시작한다고 발표하였습니다. 예전에 오바마 대통령이 당선되자 마자, 인수위원회 사이트에 OpenID를 지원한 사례[7]가 있었지만, 이렇게 정부 차원에서 지원할 줄은 몰랐습니다. 이는 오바마 대통령이 주장한 Open Government를 실현하는 매우 중요한 첫걸음입니다.

Later this morning at the Gov 2.0 Summit, Federal Government CIO Vivek Kundrawill talk about data.gov and other governmental transparency initiatives, and will also be making an announcement regarding the launch of a open identity initiative featuring the use of both OpenIDand InfoCards in a special pilot program.[1]

사전 작업: 백서

OpenID와 InfoCard 측은 몇 달전부터 이 작업에 매달리고 있었습니다. 이들이 지난 달에 공개한 백서에서는 Open Government에서 신뢰 프레임워크를 구축하기 위한 방안으로 OpenID와 InfoCard를 사용하는 내용을 담고 있었습니다. 저는 단순히 OpenID와 InfoCard가 자신들의 기술이 이런 식으로 활용될 수 있다는 가능성을 정부에게 어필하기 위한 용도라고 생각했는데, 실제로 이루어졌습니다.

The OpenID Foundation has recently published a letter from executive director Don Thibeau as well as a fairly detailed white paper(PDF) on the subject of open frameworks for open governments that youmight want to read for background. While the ‘Participating Providersin the U.S. Government Pilot Program’ section on the OpenIDFoundation’s website hasn’t gone live yet, the Information Card Foundation provides more details about the pilot program on its blog.[1]

해당 백서에는 TFPAP(Trust Framework Provider Adoption Process)라고 하여 ID 프로바이더가 정부 웹사이트에 신뢰받기 위한 절차를 언급하고 있습니다. 즉, 새로 신뢰 프레임워크를 구성하고 정부 기관에서 사용할 ID 프로바이더를 만드는 대신, 외부의 OpeniD/InfoCard 프로바이더는 누구나 제시된 기준만 만족하면 정부 기관에서 신뢰하겠다는 의미입니다. 정부는 ID 관리 부담을 덜게 되고, 사용자는 id를 재사용할 수 있으며, ID 프로바이더는 많은 사용자와 웹사이트를 확보하게 됩니다.

The government is looking to leverage industry based credentials that citizens already have to provide a scalable model for identity assurance across a broad range of citizen and business needs – doing this requires a trust framework to assess the trustworthiness of the electronic credentials. see    Trust Framework Provider Adoption Process (TFPAP).  A Trust Framework Provider is an organization that defines or adopts an online identity trust model involving one or more identity schemes,has it approved by an government or community such as ICAM,and certifies identity providers as compliant with that model. The OIDF and ICF will jointly serve as a TFP operating an Open Trust Framework as defined in their joint white paper, Open Trust Frameworks for Open Government.[3]

프로그램 내용

이번에 수행할 프로그램의 내용은 외부의 OpenID/InfoCard 프로바이더를 'Assurance Level 1'의 기준으로 평가하고 해당 보증 레벨을 부여하는 것입니다. 자세한 내용은 다음 문서("Trust Framework Provider Adoption Process for Levels of Assurance 1, 2, and non-PKI 3")를 참고하시기 바랍니다.

The draft process for selecting approved Trust Framework Providers that will then certify individual identity providers is titled "Trust Framework Provider Adoption Process for Levels of Assurance 1, 2, and non-PKI 3" and is available for download as a PDF.

That draft includes requirements that OpenID or related Info Card identities not be used to authenticate people who are physically present (it's just for remote online access), that they not be used to transmit activity data or anything else beyond what is specificallyrequested by a government agency and that there be measures taken tocontinue protecting personal information if the identity provider goesout of business.


이번 시범서비스에 참여하는 10개의 ID 프로바이더는 Google, Yahoo, PayPal, AOL, VeriSign, Citi, Equifax, Acxiom, Privo, Wave Systems입니다. Microsoft가 없는게 의야하네요. 이전 포스트에서 언급했듯이, Microsoft가 아직 정식으로 OpenID 프로바이더가 되지 않았기 때문인 것 같습니다. Microsoft는 InfoCard 프로바이더도 없죠.

Google, Yahoo, PayPal, AOL, VeriSign, Citi, Equifax, Acxiom, Privo and Wave Systems will be the ten organizations to act as digital identity providers using OpenID and Information Card technologies in the first pilot programs designed for the American public to engage in open government. Representatives from the companies had met with governmen tIT officials early August to engage in talks about the initiative,which ReadWriteWeb caught wind of at the time.[1]

해당 프로그램이 현재 적용된 사이트는 NIH(National Institute of Health, http://www.nih.gov)입니다. 보증 레벨 1 수준으로 NIH 내의 사이트에 SSO 서비스를 제공하며, 베타테스트 기간입니다. 완전한 기능은 몇 주 지나야 합니다. 흥미로운 점은 NIH에서 사용하는 OpenID 토큰으로 InCommon의 것을 사용할 예정이라는 것입니다. InCommon은 Shibboleth 프로젝트로 잘 알려진 교육용 ID 관리 Federation 사이트입니다.

Dr. Jack Jones, NIH CIO and Acting Director, CIT, notes, “As a world leader in science and research, NIH is pleased to participate in this next step for promoting collaboration among Assurance Level 1applications. Initially, the NIH Single Sign-on service will accept credentials as part of an “Open For Testing” phase, with full production expected within the next several weeks. At that time, OpenID credentials will join those currently in use from InCommon, the higher education identity management federation, as external credentials trusted by NIH.”[1]

User Interface

UI는 기존의 OpenID와 유사할 것 같습니다. RPX처럼 웹사이트가 지원하는 여러 ID 프로바이더의 로고가 출력되고, 이를 클릭한 뒤에 해당 사이트의 id/pw를 입력하는 것이죠. 관련 기사를 통틀어서 언급은 안되었지만, InfoCard는 조금 다른 방식으로 제공됩니다. InfoCard 구동 버튼을 누르거나, 혹은 html tag를 이용하여 자동으로 identity selector를 구동시키겠죠.

Most likely users will be presented with an array of logos to click on,launching a new window to communicate just with the identity provider. Once a user proves who they are to the identity provider, that companywill then vouch for the user to the government site.[2]

보안/프라이버시 문제

가장 많이 걱정되는 건 보안 문제입니다. 외부 기관, 그것도 일반 상용사이트의 안전성을 어떻게 신뢰할 수 있을까요? 더구나 상용 사이트의 인증 정보를 정부 기관에 사용하는 건 더 큰 신뢰를 요구하는 일입니다. 만일 사이트가 해킹당하거나 악의적인 내부자의 소행으로 계정정보가 노출된다면 그 피해는 상상을 초월할 것입니다.

OpenID/InfoCard 측에서도 보안과 프라이버시를 가장 중요한 항목으로 두고 이번 작업을 진행한다고 합니다. 보증 레벨을 1로 설정하고, 인증 토큰을 제외한 개인정보는 이번 단계에서는 주고 받지 않습니다. 향후에 안전성이 보장되면, 개인 정보를 주고 받게 될 것입니다.

OpenID board member and Facebook employee David Recordon explainedto ustonight that participating government sites are not allowed to passpersonal information about users from one site to another, even thoughwe'll be logging in with the same accounts. Instead, when weauthenticate ourselves with Google, Yahoo, Verisign or whoeverourIdentity Provider of choice is, that website will pass adifferent,unique URL to the government site we're logging in to.[2]

Don't worry, your doctor will not store your medical records underyourTwitter handle yet. The pilot program is stepping first into aphase of public discussion, it is participated in only by IdentityProviders that have undergone extensive scrutiny (Twitter's notincluded) and participants say that individual privacy is being treatedwith the utmost regard. If they can pull it off, these organizationscould makeusing the .gov web easier and more effective than it's everbeen before.[2]

또한 정부 기관의 보안인력은 거의 없기 때문에, 차라리 ID 관리를 위탁하는 이 방식이 좀 더 안전할 지도 모릅니다. 물론 인력을 확충하는게 최선이지만, 그게 아니라면 제대로 진행되는지 감시하는 역할에 충실해야겠죠.

ID 프로바이더의 역할이 더욱 중요해지고 공격 대상이 될 것입니다. 왜냐하면 ID 프로바이더에는 해커들이 좋아할 정보가 모두 들어가있고, 이를 이용하여 다른 사이트를 쉽게 공격할 수 있기 때문입니다. 또한 ID 프로바이더는 사용자가 해당 계정으로 어느 웹사이트를 언제/어떻게/왜 방문했는지의 정보를 기록하기 때문에 사용자의 행동 패턴이 그대로 노출될 수 있습니다. 이 또한 내부자에게 악용될 소지가 큽니다. 따라서 ID 프로바이더는 해당 정보의 관리에도 내/외부 모두 철저해야 할 것입니다.

The identity providers will keep track of all the unique URLs used toidentify us to different government sites and we'll just need toremember one log-in. That means you'll need to trust your identityprovider to keep your private information separated between agencies-it won't be up to the government sites themselves to do so.[2]

그래도 여전히 걱정되는 부분이 있습니다.[5] 이 부분은 별도로 정리해서 포스팅하겠습니다.

마무리

우선, OpenID와 InfoCard가 드디어 주류에 편입하게 되어서 기쁩니다. 특히 InfoCard는 제대로 된 대규모 적용 사례가 없었는데, 첫 사례가 대박이네요. OpenID 또한 더욱 급속도로 계속 확산될 전망입니다.

그리고 이번 사례로 정부 웹사이트가 단순히 브로셔 수준에서 벗어나 사용자와 적극적인 상호작용을 할 수 있다는 점을 보여주게 되었습니다. 업계 주도로 이루어지는 '데이터 이동성' 작업에도 정부가 주도할 수 있는 계기가 되었구요. 팀 오라일리가 Gov 2.0이 새로운 플랫폼이 되라고 주장했는데, 신뢰 프레임워크를 확보함으로써 아주 많은 것을 이루었습니다.[4] 팀 오라일리가 언급한 내용은 차니 님께서 번역하셨으니 참고 바랍니다.[8]

레퍼런스

[1] http://www.techcrunch.com/2009/09/09/us-government-to-embrace-openid-courtesy-of-google-yahoo-paypal-et-al/
[2] http://www.readwriteweb.com/archives/openid_going_mainstream_us_gov_announces_pilot_pro.php
[3] http://www.identitywoman.net/open-identity-for-open-government-explained
[4] http://www.techcrunch.com/2009/09/04/gov-20-its-all-about-the-platform/
[5] http://radar.oreilly.com/2009/08/privacy-and-open-government-co.html
[6] http://netmesh.info/jernst/big_picture/openid-and-government
[7] http://ayo79.egloos.com/3995095
[8] http://blog.creation.net/393

by S_H_Kim | 2009/09/10 23:58 | CardSpace | 트랙백 | 덧글(2)

10대 웹트렌드: 데이터 이동성

title; 10 web trends you can’t ignore.
link; http://www.widgify.com/?p=210

10 대 웹트렌드 중에 하나로 '데이터 이동성(Data Portability)'이 있네요.

Data portability as a feature -Those web-based services that make it as incredibly easy to get started with them by importing data (contacts, photos, etc) as they do toexport data to other services, will grow much more quickly than others.Thus, data portability will become a key feature in web-based service design. Technologies and standards such as Facebook Connect, Data Portability, OpenID and more will enable a world where applications can truly take advantage of user context to deliver more personalized experiences.

by S_H_Kim | 2009/01/23 21:29 | 기타 ID 동향 | 트랙백 | 덧글(2)

2008년을 빛낸 6대 웹 기술, 첫번째는 ID 관리입니다.

title; 2008년을 빛낸 6대 웹 기술
link; http://channy.tistory.com/314

차니님께서 좋은 기사를 소개하셨습니다. wired에서 2008년에 등장한 주요 웹 기술을 소개했는데, 첫번째로 Identity Management를 들었습니다. 상당히 고무적인 일이죠. 특히 Korean Identity Management라는 블로그 타이틀을 가진 제 심정을 이해하시겠죠? ㅎㅎ

지금까지 관련 업계에서 일하는 사람들만 관심가졌던 기술들이 생각보다 많이 대중화 되었습니다. OpenID가 대표적이지요. 최근에는 OpenID에 기반한 Google의 Friend Connect, MySpace의 MySpaceID가 있습니다.

반대로 세계 최대의 SNS 기업인 Facebook은 자사의 영향력을 높이고자 Facebook 플랫폼을 독자적으로 구성하였고 Facebook Connect라는 ID 관리 체계를 오픈하였습니다.

Three great technologies came to fruition this year to help you manage these complex interdependencies: OpenID, Google Friend Connect and Facebook Connect.

2008년도 데이터 이동성 분야 결산 에서 언급했던 것처럼, 이 흐름은 데이터 이동성(Data Portability)와도 크게 연관되어 있습니다.
독자적인 기술이 시장의 외면을 받은 사례는 아주 많습니다. 이번에도 마찬가지 결론이 날 것으로 예상하는데, 그게 언제가 될지는 모릅니다만..

by S_H_Kim | 2009/01/02 22:30 | CardSpace | 트랙백 | 덧글(4)

◀ 이전 페이지다음 페이지 ▶