2023年の振り返りとしてやったことをまとめる。
目標管理
例年通り、四半期ごとの見直し、月次の進捗確認で運用をした。 1,4,7,10月に目標の見直しを行い次四半期の目標を立て、2,3,5,6,8,9,11,12月は進捗を確認する運用。ただし今年は目標管理のモチベーションが低く、あまり見直しはしなかった。新しい目標を達成するというよりは、淡々と、コツコツと積み上げた形になった。昨年秋に始めた朝読書を一日も欠かさなかったし、完全に習慣化した。
論文
1月
- Culnane, Chris, Benjamin IP Rubinstein, and Vanessa Teague. "Health data in an open world." arXiv preprint arXiv:1712.05627 (2017). https://arxiv.org/pdf/1712.05627.pdf
- Narayanan, Arvind. "An adversarial analysis of the reidentifiability of the heritage health prize dataset." Unpublished manuscript (2011). https://www.cs.princeton.edu/~arvindn/publications/heritage-health-re-identifiability.pdf
4月
- Li, Ninghui, Wahbeh Qardaji, and Dong Su. "On sampling, anonymization, and differential privacy or, k-anonymization meets differential privacy." Proceedings of the 7th ACM Symposium on Information, Computer and Communications Security. 2012. https://arxiv.org/pdf/1101.2604.pdf
- Li, Ninghui, Wahbeh H. Qardaji, and Dong Su. "Provably private data anonymization: Or, k-anonymity meets differential privacy." CoRR, abs/1101.2604 49 (2011): 55. https://www.cerias.purdue.edu/assets/pdf/bibtex_archive/2010-24-report.pdf
ざっと読み、抜粋読み
1月
- Asghar, Hassan Jameel, Paul Tyler, and Mohamed Ali Kaafar. "Differentially private release of public transport data: The opal use case." arXiv preprint arXiv:1705.05957 (2017). https://arxiv.org/pdf/1705.05957.pdf
- Sweeney, Latanya. "Weaving technology and policy together to maintain confidentiality." The Journal of Law, Medicine & Ethics 25.2-3 (1997): 98-110. https://latanyasweeney.org/JLME.pdf
4月
- Ghazi, Badih, et al. "Algorithms with More Granular Differential Privacy Guarantees." arXiv preprint arXiv:2209.04053 (2022). https://arxiv.org/pdf/2209.04053.pdf
- Desfontaines, Damien, et al. "Differential privacy with partial knowledge." arXiv preprint arXiv:1905.00650 (2019). https://arxiv.org/pdf/1905.00650.pdf
- Li, Ninghui, Wahbeh Qardaji, and Dong Su. "On sampling, anonymization, and differential privacy or, k-anonymization meets differential privacy." Proceedings of the 7th ACM Symposium on Information https://arxiv.org/pdf/1101.2604.pdf
5月
- Ohm, Paul. "Broken promises of privacy: Responding to the surprising failure of anonymization." UCLA l. Rev. 57 (2009): 1701. http://www.lawlib.zju.edu.cn/attachments/file/20201118/20201118174834_66017.pdf
- Ohm, Paul. "Sensitive information." S. Cal. L. Rev. 88 (2014): 1125. https://southerncalifornialawreview.com/wp-content/uploads/2018/01/88_1125.pdf
6月
- Syomantak Chaudhuri and Thomas A. Courtade. "Mean Estimation Under Heterogeneous Privacy: Some Privacy Can Be Free" arXiv preprint arXiv:2305.09668 (2023). https://arxiv.org/pdf/2305.09668.pdf
読む本数が少なすぎるが、朝読書と違って習慣化していないのがよくない。週末は趣味の活動もあるのでうまくバランスを取りながら、数分でもいいのでコツコツと読む習慣を作るのが来年のアクション。
書籍
- 漫画を含めた書籍:
42
冊(前年比+13冊 from 29冊)
特に読んで良かった本はデータ指向アプリケーションデザイン、考える技術・書く技術、イシューからはじめよ、ナチスは「良いこと」もしたのか? 特に『ナチスは「良いこと」もしたのか?』については、歴史研究における事実/解釈/意見の三層構造に関する考え方が述べられるまえがきでもいいので、必読であった。
技術書
- データ匿名化手法 ―ヘルスデータ事例に学ぶ個人情報保護(Khaled El Emam,Luk Arbuckle/オライリージャパン)
- データ指向アプリケーションデザイン ―信頼性、拡張性、保守性の高い分散システム設計の原理(Martin Kleppmann/オライリージャパン)
- 型システム入門 −プログラミング言語と型の理論−(Benjamin C. Pierce/オーム社)
ビジネス書・趣味
- 解像度を上げる――曖昧な思考を明晰にする「深さ・広さ・構造・時間」の4視点と行動法(馬田隆明/英治出版)
- 新版 考える技術・書く技術 問題解決力を伸ばすピラミッド原則(バーバラ・ミント/ダイヤモンド社)
- イシューからはじめよ――知的生産の「シンプルな本質」(安宅和人/英治出版)
- スタッフエンジニア マネジメントを超えるリーダーシップ(Will Larson/日経BP)
- 10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く (Informatics &IDEA)(青木峰郎/SBクリエイティブ)
- ビジネスダッシュボード 設計・実装ガイドブック 成果を生み出すデータと分析のデザイン(トレジャーデータ,池田 俊介,藤井 温子,櫻井 将允,花岡 明/翔泳社)
- おそろしいビッグデータ 超類型化AI社会のリスク(山本龍彦/朝日新書/朝日新聞出版)
- 検証 ナチスは「良いこと」もしたのか?(小野寺 拓也,田野 大輔/岩波ブックレット 1080/岩波書店)
- ヒトラーの脱走兵-裏切りか抵抗か、ドイツ最後のタブー(對馬達雄/中公新書/中央公論新社)
- 批評理論入門―『フランケンシュタイン』解剖講義 (廣野由美子/中公新書/中央公論新社)
- 夏への扉(ロバート・A. ハインライン/ハヤカワ文庫SF/早川書房)
- 孤島の鬼(江戸川乱歩/創元推理文庫―現代日本推理小説叢書/東京創元社)
- 流行作家の死(野村胡堂/ゴマブックス)
- 倒れるときは前のめり(有川ひろ/角川文庫//KADOKAWA)
- 倒れるときは前のめり ふたたび(有川ひろ/角川文庫//KADOKAWA)
- アンマーとぼくら(有川ひろ/講談社文庫/講談社)
- イマジン?(有川ひろ/幻冬舎文庫 あ 34-8/幻冬舎)
記事
昨年に引き続き、英語記事に目を通すようになった。readingスキルの伸びを感じるが、まだ読むのが遅いし、疲れていると英文が頭に入ってこない。 以下は今年読んでよかった記事。
- 強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料) | PPT
- LLM Fine-Tuning (東大松尾研LLM講座 Day5資料) - Speaker Deck
- Transformer / Vision and Languageの基礎 - Speaker Deck
- 大規模言語モデルの驚異と脅威 - Speaker Deck
- 宮脇+'23 - Prompt Engineering サーベイ - Speaker Deck
- Retrieval-based LM (RAG system) ざっくり理解する - Speaker Deck
- NLPとVision-and-Languageの基礎・最新動向 (1) / DEIM Tutorial Part 1: NLP - Speaker Deck
- NLPとVision-and-Languageの基礎・最新動向 (2) / DEIM Tutorial Part 2 Vision-and-Language - Speaker Deck
- Federated Learning Tutorial (IBIS 2022) - Speaker Deck
- 進化する機械学習パラダイス ~改正著作権法が日本のAI開発をさらに加速する~|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
- ChatGPTなど生成AIによる個人情報の開示 | 調査研究/ブログ | 三井物産セキュアディレクション株式会社
- Google の新たな生成AIモデル Gemini を技術的観点で解説 - Platinum Data Blog by BrainPad
- dbt Labs のベストプラクティス全部違反してみた。そして dbt project evaluator を使って全部直してみた。
- なぜETLではなくELTが流行ってきたのか #ポエム - Qiita
- 差分プライバシーによるクエリ処理の基本・実践・最前線 - Speaker Deck
- Personalization Improves Privacy-Accuracy Tradeoffs in Federated Learning - Speaker Deck
- 高木浩光さんに訊く、個人データ保護の真髄 ——いま解き明かされる半世紀の経緯と混乱 - Cafe JILIS
- ニッポンの教育ログを考える——プライバシーフリーク・カフェ#16(後編) - Cafe JILIS
- 個人データ保護の法目的の観点から導かれる個人データ二次利用の正当性要件について, 2022年11月7日規制改革推進会議 医療・介護・感染症対策WG, 一般財団法人 情報法制研究所 副理事長 高木浩光
- 医療データ利活用の課題
- 社内用GitHub Actionsのセキュリティガイドラインを公開します | メルカリエンジニアリング
- 「私考える人、あなた作業する人」を越えて、プロダクトマネジメントがあたりまえになるチームを明日から実現していく方法/product management rsgt2023 - Speaker Deck
- 事業計画の達成はなぜ大切なのか|福島良典 | LayerX
- Kaggleで世界トップレベルになるための思考法。Grandmaster小野寺和樹の頭の中 - Findy Engineer Lab - ファインディエンジニアラボ
- “超”分析の実践:業務効率を改善する – ファミレスチェーンの利益率を向上させるには- - Kearney
- 菊池寛 私の日常道徳
- SKBパケット選抜総選挙 〜 僕たちは誰について行けばいい? 〜 /osc21do - Speaker Deck
- Amazon S3の脆弱な利用によるセキュリティリスクと対策 - Flatt Security Blog
- node_modulesの問題点とその歴史 npm, yarnとpnpm
- AI 時代のコードの書き方, あるいは Copilot に優しくするプロンプターになる方法
- URL バーの表示の変遷 | blog.jxck.io
- ブラウザでリロードしながらキャッシュの挙動を確認してる全ての開発者へ | blog.jxck.io
- 「議論だけ」のカンファレンスの作り方 | blog.jxck.io
- Recursion in SQL Explained Visually | by Denis Lukichev | The Startup | Medium
- Who Owns the Generative AI Platform? | Andreessen Horowitz
- The next big step forwards for analytics engineering
- Google Research, 2022 & beyond: ML & computer systems – Google Research Blog
- A Deep Dive Into Google BigQuery Architecture: How It Works | Panoply
- Inside Capacitor, BigQuery’s next-generation columnar storage format | Google Cloud Blog
- Building a Document-based Question Answering System with LangChain, Pinecone, and LLMs like GPT-4 and ChatGPT
Github
昨年の17 contributionsに対して、+57
となった。
Scrapbox
1611
→1764
pages