[1]

T. Chowdhury, “Reinforcement Learning from Human and AI Feedback for Large Language Model Alignment: A Review”, IJSSIC, vol. 3, no. 1, pp. 11–24, Apr. 2026.