データサイエンスの実践において、データクレンジングやデータ調製(データの加工など)は、多くの時間を費やす作業です。
また、データクレンジングによるデータの品質向上は、分析結果にも大きな影響を与えます。
私たちは、データサイエンスのこれまでの経験から、様々な種類のデータに対して、データクレンジングを効率的に行うことができます。
お役に立てること
データクレンジング業務
データサイエンスやDXが必要だけれど、データがごちゃごちゃで、何からやってよいかわからない、または、データが無い、という方へ。
データクレンジングの支援・実施を行います。また、分析対象データの整備から、一緒に考えていきます。
データ調製業務
データ調製とは、データ統合や加工などのデータ処理一式の作業のことです。
データの理解と分析データの整備
使える実績
これまでの経験や実績から、次のことが使えます。
- データクレンジング処理を効率的に行うためのソフトウェアライブラリ群の蓄積
- データクレンジング経験の豊富なデータサイエンティストチーム
- データの統計状況、データ品質(Data Quality)を調査できるツール「DataRecipe」
事例
個別の台帳で管理しているデータの統合と分析
販売履歴データの管理と商品情報の管理が、別々の台帳になっているが、これらのデータを統合して、顧客単価を向上させる分析を行いたい。
このような事例に対して、対象データ同士を紐付ける処理を行って、機械学習に導入できるよう、分析を行った。