Chowdhury, Tanay. “Reinforcement Learning from Human and AI Feedback for Large Language Model Alignment: A Review”. International Journal on Smart & Sustainable Intelligent Computing, vol. 3, no. 1, Apr. 2026, pp. 11-24, doi:10.63503/j.ijssic.2026.234.