第1回 AWSコスト削減 天下一武道会 に参加しました。オンライン参加。簡単に所感をまとめます。
所感
コスト削減は、分析からボトルネックの調査、改善まで地道な活動が必要。その分、やりがいもありそうでよさそう。刺激になる話が聴けてよかったです。
インフラコスト削減代行サービスってのがあるのか、強そう...。代行サービスとはいえ表面的ではなくドメインの深いところまで理解するから大きい効果が生み出せる。ここまでやらないといけないのね。
事業成長とコスト削減については事業フェーズによって攻めと守りのバランスが必要とのこと。あと、コスト最適化とシステム最適化が繋がる話もよかった。
パネルディスカッションでも話があったけど、他社事例やアンチパターンから学ぶことは多いのでそのあたりをアンテナ張っておくといいのかもしれない。あと、そもそもコスト意識と周りへの働きかけが大事なんだなと感じました。
そういえば、自分も気軽にデバッグしやすいようにどんどんログ埋め込んでおこうとはならなくなった。Datadog 高いし。そういう意味では以前よりコスト意識が身に付いてきたのかもしれない...。(たぶん)
アーカイブこちら。
以下、メモから抜粋。
100社のコスト診断から見えてきた、コスト削減の王道とケモノ道
- コスト削減代行サービス
- コスト削減は総力戦
- FinOps
- 全員がコストに対して責任を持つ
- AWS Well-Architected
- 料金モデル分析
- RIが使えるか
- ワークロード伸縮性 (休日夜間縮退など)
- コストに基づいてリージョンを選択する
- コスト削減の成果が早く出るだけ事業インパクトが大きい
- 全員参加
- モブコスト分析
- 各領域のエンジニアがそれぞれの観点で考える (FE/BE/インフラ)
- ドメインとアーキテクチャを繋げてみる
- プロダクトの特性まで見る
- ボトルネックを探す
- Elephant in The Room に向き合う
- バックアップ戦略見直し
- ロジック見直して無駄を削減する
- アーキテクチャ更改
- シングルテナント → マルチテナント
- インスタンス削減 (スペックが足りるなら)
- シングルテナント → マルチテナント
- データ通信量削減
- 使ってないレスポンスをなくす
節約は技術!削減は芸術!何より必要なものは覚悟!
- ボトルネックから潰す
- 覚悟を持つ
- プロダクト急成長
- 3年でMAU5倍
- 1~2万rps (スパイク時)
- AWS月額利用料 $146000
- パフォーマンスチューニング
- ボトルネックから潰す
- 支配的なコストから減らす (大きな部分から)
- 事業成長
- コスト削減が後回しになりがち
- 覚悟
- 早く削減するほど効果が大きい
- VPC Endpoint 導入
- ECR pull through cache
- ECR Public キャッシュ
- WAF ログ配信先
- CloudWatch Logs → S3
- 可視化/分析は難しくなるので注意
- 不要リソース削除
- アタッチされていないEIP削除
- 使っていない環境削除
- Gravitonインスタンス利用
- Intelに比べてコスト効率20%向上
- Auto Scaling Policy 見直し
- CloudFront Request Collapsing
- オリジンへのリクエストの折りたたみ
- TTL1秒でもキャッシュヒット率がそこそこ高い
- 削減しないと削減されない
パネルディスカッション
- ドメイン
- ヒアリングする
- ノウハウが横展開できる
- よくあるパターンがありそう
- 他社事例を学ぶ
- Aurora
- スロークエリ
- より小さいインスタンスにできるかも
- ソフトウェアエンジニアを巻き込む
- コスト削減に取り組むタイミング
- 売上に対してシステム費用の割合のラインを決めてたり
- コスト削減の必要性に気が付けるか
- Azure
- コスト削減のノウハウは少ない
AWSコストを全体で43.75%削減するためのコストモニタリング技術
- 覚悟と計測
- コスト管理責任者
- コスト計測
- 現状把握
- いつでもコストについて説明できるように - コスト管理タグ
- Cost Explorer
- コスト構造を把握する
- 変動要因
- サービスごとに分類する
- コストモニタリング技術
- ライトなコスト分析基盤
- QuickSight
大規模通信制御信号ETLシステムにおける大幅なコスト削減・意識改革の取り組み
- EC2数百台規模
- EC2 Savings Plans
- Graviton 移行
- コスト監視
- slack
- コストを見る会
- コスト意識
- 夜間縮退
クラウド利用料を半額にするために取り組んだ10+のコト
- コスト構造の抽象度を上げる
- システム最適化に付随するコスト最適化
- リアーキ
- 運用負荷/信頼性改善にも効果あるかも
新サービスリリースして早々に通信費が膨れた件
機械学習で使用しているGCSの料金を激減させた話
- 機械学習の中間成果物をGCSに保存
- GCSコスト増
- ストレージクラス最適化
- GCSの用途を分析
- アクセス頻度に応じてストレージクラスを変える
- ライフサイクル
30%のMAU増加と78%のコスト削減を両立する方法
- Cloud Composer
- 常時起動/常時課金 → 高コスト
- 基盤移行
- Cloud Scheduler + Workflows + Cloud Functions
VPCエンドポイントを活用したコスト削減
やらなきゃ損!ECS Fargateのコスト削減の手引
- Backlog Gitホスティング
- x86 → ARM64 移行
- gRPCクライアントのメモリ使用量を抑える
- http2 ウィンドウサイズが動的に変更される (増える)
- ウィンドウサイズを 64k-1 以上に
- メモリ使用量安定
- Compute Savings Plans