Jiayi Ji

Cited by

	All	Since 2019
Citations	967	965
h-index	11	11
i10-index	13	13

360

180

270

202020212022202320246 42 221 342 349

Public access

View all

7 articles

4 articles

available

not available

Based on funding mandates

Jiayi Ji

厦门大学（XMU）& 新加坡国立大学（NUS）

Verified email at xmu.edu.cn

Vision and Language Multi-modal Understanding


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Dual-level collaborative transformer for image captioning Y Luo, J Ji, X Sun, L Cao, Y Wu, F Huang, CW Lin, R Ji AAAI 2021 35 (3), 2286-2293, 2021	285	2021
Rstnet: Captioning with adaptive attention on visual and non-visual words X Zhang, X Sun, Y Luo, J Ji, Y Zhou, Y Wu, F Huang, R Ji CVPR 2021, 15465-15474, 2021	224	2021
Improving image captioning by leveraging intra- and inter-layer global representation in transformer network J Ji, Y Luo, X Sun, F Chen, G Luo, Y Wu, Y Gao, R Ji AAAI 2021 35 (2), 1655-1663, 2021	166	2021
Towards local visual modeling for image captioning Y Ma, J Ji, X Sun, Y Zhou, R Ji Pattern Recognition 138, 109420, 2023	47	2023
Variational structured semantic inference for diverse image captioning F Chen, R Ji, J Ji, X Sun, B Zhang, X Ge, Y Wu, F Huang, Y Wang NeurIPS 2019, 1931-1941, 2019	35	2019
Knowing what to learn: a metric-oriented focal mechanism for image captioning J Ji, Y Ma, X Sun, Y Zhou, Y Wu, R Ji IEEE Transactions on Image Processing 31, 4321-4335, 2022	33	2022
X-mesh: Towards fast and accurate text-driven 3d stylization via dynamic textual guidance Y Ma, X Zhang, X Sun, J Ji, H Wang, G Jiang, W Zhuang, R Ji ICCV 2023, 2749-2760, 2023	31	2023
Knowing what it is: semantic-enhanced dual attention transformer Y Ma, J Ji, X Sun, Y Zhou, Y Wu, F Huang, R Ji IEEE Transactions on Multimedia, 2022	20	2022
Towards Real-Time Panoptic Narrative Grounding by an End-to-End Grounding Network H Wang, J Ji, Y Zhou, Y Wu, X Sun AAAI 2023, 2023	15	2023
Multi-Branch Distance-Sensitive Self-Attention Network for Image Captioning J Ji, X Huang, X Sun, Y Zhou, G Luo, L Cao, J Liu, L Shao, R Ji IEEE Transactions on Multimedia, 2022	15	2022
Attacking image captioning towards accuracy-preserving target words removal J Ji, X Sun, Y Zhou, R Ji, F Chen, J Liu, Q Tian ACM MM 2020, 4226-4234, 2020	14	2020
Towards Semantic Equivalence of Tokenization in Multimodal LLM S Wu, H Fei, X Li, J Ji, H Zhang, TS Chua, S Yan arXiv preprint arXiv:2406.05127, 2024	10	2024
Beyond first impressions: Integrating joint multi-modal cues for comprehensive 3d representation H Wang, J Tang, J Ji, X Sun, R Zhang, Y Ma, M Zhao, L Li, Z Zhao, T Lv, ... ACM MM 2023, 3403-3414, 2023	10	2023
Beat: Bi-directional One-to-Many Embedding Alignment for Text-based Person Retrieval Y Ma, X Sun, J Ji, G Jiang, W Zhuang, R Ji ACM MM 2023, 4157-4168, 2023	8	2023
X-RefSeg3D: Enhancing Referring 3D Instance Segmentation via Structured Cross-Modal Graph Neural Networks Z Qian, Y Ma, J Ji, X Sun AAAI 2024 38 (5), 4551-4559, 2024	7	2024
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation S Liu, Y Ma, X Zhang, H Wang, J Ji*, X Sun, R Ji CVPR 2024, 2023	7	2023
X-dreamer: Creating high-quality 3d content by bridging the domain gap between text-to-2d and text-to-3d generation Y Ma, Y Fan, J Ji, H Wang, X Sun, G Jiang, A Shu, R Ji arXiv preprint arXiv:2312.00085, 2023	7	2023
Semi-Supervised Panoptic Narrative Grounding D Yang, J Ji*, X Sun, H Wang, Y Li, Y Ma, R Ji ACM MM 2023, 7164-7174, 2023	7	2023
3D-STMN: Dependency-Driven Superpoint-Text Matching Network for End-to-End 3D Referring Expression Segmentation C Wu, Y Ma, Q Chen, H Wang, G Luo, J Ji*, X Sun AAAI 2024, 2023	6	2023
NICE: Improving Panoptic Narrative Detection and Segmentation with Cascading Collaborative Learning H Wang, J Ji, T Guo, Y Yang, Y Zhou, X Sun, R Ji arXiv preprint arXiv:2310.10975, 2023	4	2023

The system can't perform the operation now. Try again later.

Articles 1–20

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by