README.md

March 14, 2025 · View on GitHub

IPAD

IPAD, iteratively pruning and distillation to shrink model size.

Installation

Clone this repository and navigate to PainlessInferenceAcceleration

git clone https://github.com/alipay/PainlessInferenceAcceleration.git
cd PainlessInferenceAcceleration/ipad

Install Package

python setup.py install

@inproceedings{10.1145/3589335.3648321, author = {Wang, Maolin and Zhao, Yao and Liu, Jiajia and Chen, Jingdong and Zhuang, Chenyi and Gu, Jinjie and Guo, Ruocheng and Zhao, Xiangyu}, title = {Large Multimodal Model Compression via Iterative Efficient Pruning and Distillation}, year = {2024}, isbn = {9798400701726}, publisher = {Association for Computing Machinery}, doi = {10.1145/3589335.3648321}, booktitle = {Companion Proceedings of the ACM Web Conference 2024}, pages = {235–244}, series = {WWW '24} }

README.md

IPAD

News or Update 🔥

Models we support

Introduction

Installation

Quick Start

Citations