スキップしてメイン コンテンツに移動

AI時代に向けたオープンデータ化とオープンデータの活用の推進 -- CEATEC JAPAN 2018 カンファレンス



AI時代に向けたオープンデータ化とオープンデータの活用の推進

【主催者による概要など】


【メモ&コメント】

  • テーマは「オープンデータ」。タイトル頭の「AI時代の」は、ほぼ内容には関係無い。「○○時代の」と付くときはほぼ客引きの装飾でしかない。
  • 全体をまとめると、「オープンデータ×○○業界」。(最後の犯罪予測は業界じゃないかもしれないが)。
  • いろんな業界からの取り組み方や狙いどころの話を聞けるのは、やっぱり興味深い。

(概要) 東京大学大学院情報学環/ユビキタス情報社会基盤研究センター 副学環長・教授/センター長 越塚登 氏

【メモ&コメント】

  • この講演というか導入スピーチはAIをからめてきた。「オープンデータ×AI」。最近は、なんでも○○×△△。まぁ、私らも使うけど。
  • オープンデータに必要なこと= プログラムが書きやすいこと、データ形式、API、ライセンス、データの量、品質、etc。←なるほど。
  • 日本のオープンデータは,
    • (1) data.go.jpというサイトに情報が集まっている。 「でもPDFが多い」らしい。
    • (2) 諸外国と違って交通機関が民間企業で、オープンデータとして出てきにくい。

(基調講演) 理化学研究所革新知能統合研究センター/東京大学 センター長/教授 杉山将氏

【メモ&コメント】

  • 機械学習(ML)のおさらい講演。
  • 適用分野によっては教師付き学習のデータが取りにくい。医療とか。

NTTドコモ 法人ビジネス本部IoTビジネス部 先進ビジネス推進担当部長 那須和徳 氏

【メモ&コメント】

  • 「AIタクシー」=ドコモが商用サービス化済。乗客数(密度?)の的中率95%。
  • 自社データ(携帯電話分布)+他社データ(taxi走行)+オープンデータ(気象とか)を組み合わせる。これにより近い未来(少し先の時間)の予測に。
  • 移動手段+観光施設(商業施設)をタイアップさせて、MaaSへ。横浜で実証実験中(無料バス)。

株式会社ローソン 経営戦略本部 副本部長 秦野芳宏 氏

【メモ&コメント】

  • 業種特有の事情話はおもしろい。
  • 目標はリテール業の問題解決に役立てること
  • AIによる変革→→チェーンストアそのものの改革につなげられるはず。
  • 考え方の基本は、「ある1店舗の成功ノウハウを他店にも広げる」。これまでは、これを人手(指導員)がやってた。→AIで実現していく。
  • 実績: 2015年に発注を自動化(機械学習)。
  • でも、人による工夫や意思も、やっぱり大事。{←最後にきれいにまとめてきた}

株式会社Singular Perturbations 代表取締役 梶田真実 氏

【メモ&コメント】

  • 犯罪予測までも、オープンデータを使って、民間が事業として行う時代。ある意味でマイノリティレポート(映画)の世界を超えているとも言える。
  • この会社では、犯罪予測情報を「クライムナビ」というスマホアプリで提供することを準備中とのこと。
  • 犯罪の発生データはオープンデータとして公開されつつあるのが世界の潮流らしい。日本では(東京では?)ようやく翌月に1ヶ月分が出てくるようになったが、諸外国(先進国だろうが)では翌日には公開されるところがいくつもあるとか。
  • そんなこんなで、日本でも「犯罪予測ベンチャー」がたくさん登場しつつあるらしい。
  • ただ、日本ではデータというものがなかなか出てこない。オープンデもクローズでも。犯罪データに限らず他の分野でも。データ分析の手法を開発する能力がある人たちがいるのに、その人たちがデータに触れることができない。「改善してほしい」と。

--

コメント

このブログの人気の投稿

5600ページのIEEE 802.3-2018が入手可能になった

IEEE 802.3の名称は今では「IEEE Standard for Ethernet」になっている。 「イーサネットとIEEE 802.3は別物なんだよ」という話は,今では昔話でしかない。もうひとつ“いまはむかし”な話をすると,「イーサネットはCSMA/CDだよ」なんて言うと恥をかくのでやめた方がいい。こちらは名称の問題では無く中身の話だが,ここでは詳しい説明は割愛する。 この「イーサネット標準」の2015年以来の改訂版が,2018年8月に発行。6ヶ月のIEEE会員限定期間が過ぎたので,一般にも入手可能になった。ただし個人アカウントは取得する必要がある。この話は以前に書いた ( https://nmizos.blogspot.com/2017/12/ieee802.html 参照)。 https://ieeexplore.ieee.org/document/8457469 このネタをブログにしようと思った動機はタイトルに記してしまった。この規格は改定されるたびにドンドン太って巨大になってきている。本編改訂の間に発行されたamendment (補遺と訳すのがいいのかな)が取り込まれるので,太るのはしょうがない面もある。でもねぇ,ついに5600ページ。もちろん通し読みするようなものじゃない。PDFファイルなので「厚さ」は無いが,印刷したらどれくらいになるんだろう。 参考までに,過去10年の本編のボリュームを比較してみた。  2008 = 5分割,2977ページ  2012 = 6分割,3748ページ  2015 = 4017ページ,56Mバイト  2018 = 5600ページ,98Mバイト 以前は数セクションにファイルを分割して公開されていた。ファイルが大きすぎるのを気にしてたんだろう。2018版も中身は8セクションに分かれている(ページ番号も別に付いている)のを,PDFファイルとしては合体してある。100Mバイト程度のPDFが「デカ過ぎて開けない」ってことも無いだろうから,1本になっていた方が全文検索ができて都合がいい。ちなみにiPadで開いて全文検索しても,今の98Mバイトなら困らない。 参考までに,無線LANのIEEE 802.11の方は,802.11-2016が3534ページ。こちらも結構なもんだ。 --

IEEE802標準文書の入手

■概要 入手方法が変わった。たぶん2017年のどこかから。 ダウンロードの都度メルアド等を入力するのではなくて,メンバ登録&ログイン形式に。 個別の参照(入手)時点の操作も変わった。 概要の表示ページから“Download PDF”を選ぶとPDFファイルが呼び出されるが… 即ダウンロードでは無くて,(ブラウザ依存だと思うがFirefoxの場合は)インラインでPDF表示になるので,その後に表示しているPDFをダウンロードさせることになる。 802.3の場合は困ったことに文書がデカ過ぎる。従来は複数パート(セクション)にPDFが分割されていたが,参照方法が上記の様に変わったのに合わせて,802.3全体が1本のPDFに。なんと4000ページ超,50MB超の1本のPDFになり,それをまとめてインライン表示しようとするので,待ち時間がとても長い。メモリの少ないPCだと途中でアカンことになりそう。   ---- ■操作 入口=  http://ieeexplore.ieee.org/browse/standards/get-program/page/series?id=68 (  http://ieeexplore.ieee.org/  からでもたどれるだろう )。 メニューをたどって,例えばIEEE 802.11(無線LAN)の標準文書を参照しようとすると… “Download PDF”は選択できなくなっている。 画面最上部の“Personal Sign In”からログインすると… “Donwload PDF”が有効になる。 概要でも記したように標準文書フルテキストPDFのダウンロードは,Firefoxの場合にブラウザのインラインでの表示になるので,保存する場合にはブラウザの操作でファイル保存する。 ユーザ登録は“Create Account”から。 入力方法などは自助努力で。(画面のガイダンスや注意事項を読みましょう)。 --

RFCは番号を無駄遣いしていないか?

新規に発行されるRFCの番号が8000番台になっていて,その8000番台も1年くらいで食い潰しそうな勢いだ。実は8年ほど前にも同じ様に「なんと6000番台後半だよ」と思ったのだった。 ところで,RFCの番号って,几帳面にきっちりと順番に使っているわけでは無い。大物RFCにはキリ番を使うことがある様だし(RFC 8200とか),規格のバージョンアップの際には旧番号から覚えやすいものにすることがある(RFC 822 → RFC 2822など)。 …ということは,ところどころ虫食い状態で空き番号がたくさんあるんじゃないかな?と,ふと思った。 RFCの一覧ページはこれ:   https://tools.ietf.org/rfc/ これを眺めると,ところどころに「Not Issued」となっている番号があるので,虫食いになっているのはたしかなようだ。無効化(Obsoletes)されたRFCもたくさんあるけれど,一度は使われた番号だから,これについては「使った」ということでいいだろう。 もう1つの一覧形式で,Mini-Indexページなるものがあった:   https://tools.ietf.org/rfc/mini-index ぱっと見で,虫食い状態がわかる。言い換えるとそれしかわからない。 上記のMini-IndexのHTMLを解析して,具体的にどれくらい虫食いなのかを調べて見た。単なる酔狂でしかないけれど。 結果(RFC 8754まで) 個数 RFC番号  735 8000番台  996 7000番台  973 6000番台  971 5000番台  973 4000番台  982 3000番台 1000 2000番台  995 1000番台  933 999番以下 こうしてみると,最初の999番までが一番大雑把だ。 RFC化の検討に入ったけど最終的に発行されないものもあるから,2000番台の様に完全に埋まることは珍しいと思う。そういう意味では,まぁまぁ,几帳面に番号割当てをしていると思っていいのだろう。 さて,RFC 10000に到達するまで残り約1250。そこに達するのは,だいたい4年ちょっと後の2024年頃だろうか。 【参考: カウントスクリプト】 : count.sh #...