南京大學自然語言處理研究組2024年NLP夏令營招募公告

發布時間:2024-06-13 編輯:保研喵

添加南京大學學姐微信,或微信搜索公眾號“保研喵Pro”,關注[保研喵Pro]微信公眾號,在保研喵Pro微信號輸入[南京大學保研夏令營條件、南京大學保研加分細則、南京大學保研群、南京大學保研學姐微信、南京大學保研真題、南京大學夏令營2023]即可在手機上查看相對應南京大學保研信息和免費資源
回復[夏令營信息][保研去向][保研來源][入營名單]即可查看蕞新蕞全的保研數據。

南京大學自然語言處理研究組2024年NLP夏令營招募公告內容如下,更多考研資訊請關注我們網站的更新!敬請收藏本站,或下載我們的考研派APP和考研派微信公眾號。

南京大學自然語言處理研究組2024年NLP夏令營招募公告 正文

注意:該夏令營與計算機系以及人工智能學院的推免夏令營無關。
南京大學自然語言處理研究組(NJUNLP)是國內最早從事NLP領域科研工作的團隊之一,先后承擔國家科技攻關項目、863項目、國家自然科學基金、江蘇省自然科學基金等20項,獲國家七五科技攻關重大成果獎1次、教育部科技進步獎2次、江蘇省科技進步二等獎、三等獎各一次;近3年在自然語言處理和人工智能頂級會議上(ACL、AAAI、IJCAI、EMNLP等)發表論文四十余篇,累計發表論文200+篇;多次參與自然語言處理相關的比賽和評測,并獲得第一(WMT2023-QE、WMT2022-QE(機器翻譯質量自動評估)評測英德語言方向多個任務、CCF-BDCI2018情感分析、NLPCC2012分詞、SIGHAN2006命名實體識別)。
研究組開展的本科生NLPSummerCamp活動旨在為本科生提供了解自然語言處理及運用自然語言處理技術解決實際問題的平臺。今年該活動受到江蘇省計算機學會—2024年江蘇省研究生”計算機科學之美:從理論計算到大語言模型”暑期學校項目支持。該活動設置若干自然語言處理領域的前沿課題,每個課題由本組優秀博士生擔任組長。在報名開始時,同學們可以自愿選擇感興趣的課題。在報名結束后,研究組將根據課題方向組織面試選拔,通過選拔的同學可以正式參與夏令營活動。完成課程和相應課題的同學在活動結束后將獲得南京大學計算機科學與技術系印發的結題證書,后期申請保研至NLP研究組時會被優先考慮,入學后憑該證書有機會兌換相應研究生課程學分。
一、項目計劃
舉辦形式:本次夏令營采用線上與線下相結合的模式,南京大學本校生線下參與,外校學生線上參與。
項目周期:7月1日-8月11日,為期6周,前1周集中培訓,后5周自主學習,并跟隨組長進行項目實戰。
項目內容:共有6個課題,后期設有通識講座、基礎課程以及學術論壇。
招募人數:計劃每個課題招募3-5名學員。
二、項目要求
申請對象:原則上僅限大三及以下的在校本科生報名,優先考慮具有自然語言處理或機器學習基礎知識的大一、大二在校本科生。
時間安排:本次夏令營是為期六周的全程跟進學習,請有意參加夏令營的同學提前安排好時間,避免出現安排沖撞、時間精力不足以及中途退出等情況。
三、申請流程
網上申請
即日起,可登錄:https://wj.qq.com/s2/14712744/8fio/,填寫報名信息,申請截止時間為:6月18日23:59。
資格初審
申請截止后,工作小組對申請者提供的報名信息進行資格初審,面試名單,預計在6月20日以公眾號以及郵箱形式發布。面試時間初定于:6月22日-6月24日。
結果發布
面試結束后,工作小組結合學員信息以及面試情況,確定夏令營入圍名單,預計在6月26日公布。
以上項目流程公布日期均為擬定,具體時間以后續通知為準,請對夏令營感興趣的同學按照初步擬定的日期安排規劃好自己的時間,并在此期間及時關注自己的郵箱以及我們的公眾號,避免出現錯過通知的情況。
四、課題名稱
課題1:上下文學習增強的生物分子大語言模型研究
隨著大語言模型(LLM)和AI4Science的蓬勃發展,越來越多的工作開始關注生物分子與自然語言的聯合建模,大量生物分子LLM被提出。這些方法利用豐富的生物化學科學文獻、數據庫數據對LLM后訓練,增強了LLM對生物分子數據的理解,提高了其分子描述、分子-文本跨模態檢索的能力。但面對分子屬性預測這一更具實際意義的任務時,現有生物分子LLM表現欠佳。我們擬基于上下文學習,設計合適的示例選擇、模板設計策略,提高生物分子LLM的屬性預測能力。
課題2:大型多模態模型知識學習能力探究
大型多模態模型(LargeMultimodalModel,LMM)被認為是通向通用人工智能AGI的關鍵之一,近期受到了研究者們廣泛的關注。目前LMM在視覺感知、推理、世界知識等任務上有著出色的表現。對于人類而言,除了這些已經掌握的能力外,人們在日常生活中會不斷學習新的知識,并在之后的決策中利用它。例如記住認識的新朋友的名字或某種奶茶的味道。本課題計劃探索當前最先進的開源和閉源LMM學習此類新知識的能力,并研究不同學習方法(例如情景學習和參數微調)對模型知識學習的影響。
課題3:大語言模型的結構化文本生成
大語言模型(LLMs)在語言理解和生成方面展示了非凡的能力,它不僅能生成富有創造性和多樣性的回復,還能高度適應各種用戶需求。盡管LLM無拘無束的創造力在對話場景中十分重要,然而,當把它們集成到LLM驅動的應用開發中時,必須限制它們的輸出遵循特定的格式或標準。例如,用戶可能會要求文章摘要"嚴格少于20個字"以滿足長度限制,或者要求LLM返回能被解析的有效JSON,以滿足開發流水線的要求。
然而,即使在提示中明確定義了約束條件,目前最先進的LLM仍然無法保證生成的輸出始終符合用戶的要求。雖然研究人員提出了各種方法來提高可控性,如利用專門數據集進行有監督的微調,但這些方法往往只關注解決范圍較窄的約束,并且受到數據和訓練成本的限制。針對以上問題,本課題重點關注LLM受控解碼策略,帶領營員探索基于有限狀態機的正則表達式約束生成以及基于下推自動機的json約束生成,同時對不同字段引入細粒度約束,并評估方法的約束能力以及對LLM性能的潛在影響。
課題4:翻譯評估視角的大語言模型可解釋性分析
大語言模型(LLM)在多類任務上都展現出了不俗的表現,然而,這些模型的復雜性和黑箱特性使得理解其內部工作機制變得困難。本課題將從翻譯評估任務的角度,分析大語言模型的翻譯評估過程和結果,探討其可解釋性。在大語言模型中,不同的注意力頭可能具有不同的功能。通過深入研究模型在不同語言對和翻譯評估任務中的表現,我們希望能夠識別出語言和任務相關的神經回路,為模型在處理翻譯評估任務時的行為給出較為可靠的解釋。進一步,探討如何根據解釋的結果來改進模型在此任務上的表現。
課題5:大語言模型數學推理能力探究
目前大語言模型(LLMs)在諸多任務上展現了強大的能力,然而,即使是最強大的模型(如GPT4),復雜數學推理能力仍有待加強。為此,研究人員通過思維鏈技術(CoT)激發現有大模型的推理能力,并通過設計訓練流程和驗證策略以進一步提升模型的數學能力。本次夏令營中,課題組將帶領營員回顧近年來基于大模型的數學解題技術,并復現數學解題模型訓練流程,試圖探索模型在數學推理上的能力邊界并嘗試進行改進。
課題6:大語言模型情緒激發能力探究
AI技術的發展遠超我們的想象,在以ChatGPT為代表的LLM誕生以來,互聯網中越來越多的AI在未經研究的情況下被直接應用了。舉例來說,b站已經出現了不少AIVtuber/AI主導的up。他們都在某種程度上為人們提供情緒價值/情緒輸出。正向的情緒價值自然是有意義的,但是,其中也會蘊含著很多風險-AI對人是不是也會產生負面的情緒影響?盡管傳統對話系統已經研究了如何生成empathy、安全的內容,但AI對于人類情緒的激發能力一直沒被充分探索。類人表達能力的大幅提升或許可以帶來更多的可能性,特別是在心理疏導、診療等領域。因此,本課題將探索AI激發人類情緒的能力,具體來說,我們可能會探索以下問題:
機器可不可以激發人的指定情緒?這種激發能力有什么特點?
如果可以,可不可以通過一些設計來強化這種激發能力?
如有任何疑問,請聯系郵箱:[email protected]

南京大學相關保研資源下載:

南京大學歷年保研筆試/面試真題匯編.pdf
南京大學保研夏令營信息匯總表.xls
南京大學預推免信息匯總表.xls
南京大學保研生源分析表.xls
南京大學本科生保研去向分析表.xls
各重點院校保研夏令營信息匯總表(報名截止時間).zip
各重點院校推免生條件及要求匯總表.zip

南京大學

添加南京大學學姐微信,或微信搜索公眾號“保研喵Pro”,關注【保研喵Pro】微信公眾號,在保研喵Pro公眾號輸入【南京大學保研夏令營條件、南京大學保研加分細則、南京大學保研群、南京大學保研學姐微信、南京大學保研真題、南京大學夏令營】即可在手機上查看相對應南京大學保研信息和免費資源
回復【夏令營信息】【保研去向】【保研來源】【入營名單】即可查看蕞新蕞全的保研數據。
南京大學保研


本文來源:http://www.btfokj.cn/nanjingdaxue/byxly_904611.html

推薦閱讀