[1]

Chowdhury, T. 2026. Reinforcement Learning from Human and AI Feedback for Large Language Model Alignment: A Review. International Journal on Smart & Sustainable Intelligent Computing. 3, 1 (Apr. 2026), 11–24. DOI:https://doi.org/10.63503/j.ijssic.2026.234.