AI底層算法創(chuàng)新的專利撰寫:如何兼顧權(quán)利要求保護(hù)范圍和客體問題?(上)
摘 要
為了貫徹落實(shí)中央十九大報(bào)告中指出的“加快推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實(shí)體經(jīng)濟(jì)深度融合”,以及習(xí)近平總書記在中共中央政治局第二十五次集體學(xué)習(xí)時(shí)強(qiáng)調(diào)的“要完善大數(shù)據(jù)、人工智能、基因技術(shù)等新領(lǐng)域新業(yè)態(tài)專利審查標(biāo)準(zhǔn)”等要求,國家知識產(chǎn)權(quán)局在2021年8月3號對外發(fā)布的《專利審查指南修改草案(征求意見稿)》中,對于大數(shù)據(jù)、人工智能等領(lǐng)域的發(fā)明的專利客體、創(chuàng)造性判斷等問題,進(jìn)一步明確了審查標(biāo)準(zhǔn)。雖然,目前專利審查指南的更新版本還未生效,但知識產(chǎn)權(quán)從業(yè)人員可從中窺見最新審查政策的導(dǎo)向。因此,基于目前專利審查指南的修訂內(nèi)容,結(jié)合多個(gè)典型案例,文章深入探討了涉及AI算法本身改進(jìn)的案例撰寫方法,以期兼顧此類專利申請的客體問題以及權(quán)利要求保護(hù)范圍問題之間的平衡。
關(guān)鍵詞:AI算法專利;基礎(chǔ)層創(chuàng)新;技術(shù)層創(chuàng)新;客體;權(quán)利要求保護(hù)范圍
>>> 一、引 言
近幾年,人工智能技術(shù)的發(fā)展勢頭迅猛,許多創(chuàng)新主體的創(chuàng)新方向已經(jīng)從原來的應(yīng)用層創(chuàng)新逐漸過渡到AI技術(shù)的底層算法本身的創(chuàng)新。各大創(chuàng)新主體對涉及AI算法類發(fā)明專利的保護(hù)需求也越來越強(qiáng)烈,尤其是對涉及機(jī)器學(xué)習(xí)的算法本身改進(jìn)的發(fā)明專利申請的保護(hù)需求最為突出。
2020年2月1號施行的專利審查指南[1],雖在相關(guān)規(guī)定中給出了包含算法特征和方法特征的案件的客體審查基準(zhǔn),但創(chuàng)新主體對于而今的涉及AI算法本身創(chuàng)新的專利申請的客體審查判斷仍然存在一定的困難。例如,現(xiàn)行的審查指南中僅明確規(guī)定了“對一項(xiàng)包含算法特征和方法特征的權(quán)利要求是否技術(shù)方案進(jìn)行審查時(shí),需要整體考慮權(quán)利要求中記載的全部特征。如果該項(xiàng)權(quán)利要求記載了對要解決的技術(shù)問題采用了利用自然規(guī)律的技術(shù)手段,并由此獲得符合自然規(guī)律的技術(shù)效果,則該權(quán)利要求限定的解決方案屬于專利法第二條第二款所述的技術(shù)方案。例如,權(quán)利要求中涉及算法的各個(gè)步驟體現(xiàn)出與所要解決的技術(shù)問題密切相關(guān),如算法處理的數(shù)據(jù)是技術(shù)領(lǐng)域中具有確切技術(shù)含義的數(shù)據(jù),算法的執(zhí)行直接體現(xiàn)出利用自然規(guī)律解決某一技術(shù)問題的過程,并且獲得了技術(shù)效果,則通過該權(quán)利要求限定的解決方案屬于A2.2所述的技術(shù)方案[2]”。由此不難看出,現(xiàn)行的審查指南對于算法類專利申請案具有明確的規(guī)定,即算法類案件中涉及到的數(shù)據(jù)必須是技術(shù)領(lǐng)域中具有確切技術(shù)含義的數(shù)據(jù),即規(guī)定了算法類案件要想通過客體審查的關(guān)口必須要與技術(shù)領(lǐng)域相結(jié)合,這無疑限縮了算法類案件的保護(hù)范圍。
從各大創(chuàng)新主體的需求來看,未來的AI領(lǐng)域創(chuàng)新可能很大程度上傾向于算法本身的創(chuàng)新,例如:數(shù)學(xué)模型、參數(shù)優(yōu)化上的創(chuàng)新,此類創(chuàng)新既可應(yīng)用于A領(lǐng)域,也可應(yīng)用于B領(lǐng)域,這在未來技術(shù)創(chuàng)新的道路上并不排除AI算法成為一種通用的工具,且無具體領(lǐng)域的限定。正如,現(xiàn)在被大家日常所用的計(jì)算機(jī),在很多年以前也是技術(shù)的,以此類比到而今的AI算法專利——雖然技術(shù)性很強(qiáng),但也難保在很多年后可能被人類作為通用工具,其并不局限在某一個(gè)領(lǐng)域??紤]到社會創(chuàng)新未來的發(fā)展,并且基于各大創(chuàng)新主體涉及AI算法專利的創(chuàng)新保護(hù)需求,國家知識產(chǎn)權(quán)局圍繞人工智能和大數(shù)據(jù)領(lǐng)域也在嘗試補(bǔ)充現(xiàn)有規(guī)定未涉及的客體審查基準(zhǔn),以期和公眾一起探討未結(jié)合具體技術(shù)領(lǐng)域的人工智能算法改進(jìn)方案如何構(gòu)成專利保護(hù)的客體,從而嘗試給涉及AI算法本身改進(jìn)的案件一條通過客體審查的出路,與此同時(shí),也兼顧了此類案件的保護(hù)范圍。
基于該初衷,國家知識產(chǎn)權(quán)局2021年8月3日公布的《專利審查指南修改草案(征求意見稿)》中,于第二部分第九章6.1.2節(jié)補(bǔ)充了有關(guān)人工智能算法的改進(jìn)方案的審查基準(zhǔn),具體為“如果權(quán)利要求的解決方案涉及深度學(xué)習(xí)、分類聚類等人工智能、大數(shù)據(jù)算法的改進(jìn),該算法與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)存在特定技術(shù)關(guān)聯(lián),能夠解決如何提升硬件運(yùn)算效率或執(zhí)行效果的技術(shù)問題,包括減少數(shù)據(jù)存儲量、減少數(shù)據(jù)傳輸量、提高硬件處理速度等,從而獲得符合自然規(guī)律的計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果,則該權(quán)利要求限定的解決方案屬于專利法第二條第二款所述的技術(shù)方案”。
上述內(nèi)容實(shí)際上釋放出了三層審查基準(zhǔn):
(1)審查權(quán)利要求中的解決方案是否涉及深度學(xué)習(xí)、分類聚類等人工智能、大數(shù)據(jù)的算法
(2)審查該算法是否與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)有特定技術(shù)關(guān)聯(lián)
(3)審查該算法所帶來的技術(shù)效果是否能夠帶來計(jì)算機(jī)內(nèi)部性能的改進(jìn)
若以上三層審查基準(zhǔn)都滿足,則權(quán)利要求中的解決方案即使沒有明確規(guī)定應(yīng)用領(lǐng)域,也符合A2.2規(guī)定的技術(shù)方案。
故而,基于對本次征求意見稿中審查指南補(bǔ)充的新的審查基準(zhǔn)的理解,筆者同步結(jié)合以下幾個(gè)典型案例,詳細(xì)為大家剖析國家知識產(chǎn)權(quán)局對于AI算法類案件的審查方向的變化。
>>> 二、以下專利申請案為何能順利通過A2.2的客體審查?
首先,我們需明確AI算法類案件的創(chuàng)新包括哪些類型;談及此處,則需了解AI技術(shù)的技術(shù)架構(gòu)。
AI技術(shù)架構(gòu)從上到下,分為AI應(yīng)用層和AI底層算法,而AI底層算法包括AI基礎(chǔ)層算法和AI的技術(shù)層算法。這三個(gè)層在各大創(chuàng)新主體的研發(fā)過程中經(jīng)常會涉及到創(chuàng)新的技術(shù)點(diǎn)。
何為AI“應(yīng)用層”創(chuàng)新?
此類創(chuàng)新是AI技術(shù)與各種應(yīng)用場景的結(jié)合。
AI應(yīng)用層是人工智能產(chǎn)業(yè)的延伸,集成一類或多類人工智能基礎(chǔ)應(yīng)用技術(shù),面向特定應(yīng)用場景需求而形成軟硬件產(chǎn)品或解決方案。
例如,我們經(jīng)??吹降闹悄荞{駛、智能金融、智能醫(yī)療或者機(jī)器人等,都是常見的AI技術(shù)在應(yīng)用場景上的創(chuàng)新。
何為AI“底層算法”創(chuàng)新?
實(shí)際上此類創(chuàng)新包含AI基礎(chǔ)層的創(chuàng)新以及AI技術(shù)層的創(chuàng)新。
AI基礎(chǔ)層主要包含基礎(chǔ)硬件設(shè)施、算力平臺、數(shù)據(jù)資源等,其聚焦的是計(jì)算能力和數(shù)據(jù)資源,為人工智能提供數(shù)據(jù)及算力支撐;
AI技術(shù)層聚焦在算法和模型上,主要包括操作系統(tǒng)、模型框架以及神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、遺傳算法等模型構(gòu)建或者模型訓(xùn)練算法的創(chuàng)新。
針對AI底層算法類創(chuàng)新的案件,實(shí)際上無論是基礎(chǔ)層的創(chuàng)新還是技術(shù)層的創(chuàng)新,過去幾年中行業(yè)內(nèi)處理此類案件常見的做法是將其算法創(chuàng)新與具體的技術(shù)領(lǐng)域相結(jié)合,以滿足客體審查基準(zhǔn);但隨著中央十九大報(bào)告的出臺以及針對AI案件國家知識產(chǎn)權(quán)局一系列利好的修訂內(nèi)容,部分企業(yè)做了新的撰寫嘗試,并且取得了較好的結(jié)果。
接下來,筆者詳細(xì)將分析此類案例,其中,案例一至案例三涉及的是AI技術(shù)層的創(chuàng)新專利,案例四和案例五涉及的是AI基礎(chǔ)層的創(chuàng)新專利。
案例一
背景技術(shù):
自訓(xùn)練方法是一種利用神經(jīng)網(wǎng)絡(luò)模型自身的學(xué)習(xí)結(jié)果對模型進(jìn)行迭代訓(xùn)練的方法。傳統(tǒng)的自訓(xùn)練方法通常需要對樣本數(shù)據(jù)D進(jìn)行數(shù)據(jù)增廣,得到數(shù)據(jù)D';使用神經(jīng)網(wǎng)絡(luò)模型對數(shù)據(jù)D'進(jìn)行預(yù)測,得到數(shù)據(jù)D'中各數(shù)據(jù)的輸出結(jié)果;合并數(shù)據(jù)D與數(shù)據(jù)D',繼續(xù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。直到達(dá)到終止條件。對于傳統(tǒng)的自訓(xùn)練方法來說,神經(jīng)網(wǎng)絡(luò)模型的每一次訓(xùn)練,均需要執(zhí)行數(shù)據(jù)增廣與使用神經(jīng)網(wǎng)絡(luò)模型對增廣數(shù)據(jù)進(jìn)行預(yù)測的步驟,因此神經(jīng)網(wǎng)絡(luò)模型在進(jìn)行自訓(xùn)練時(shí)所需的時(shí)間成本較高,步驟較為繁瑣。
權(quán)利要求1 如下:
1.一種自訓(xùn)練方法,包括:
獲取訓(xùn)練數(shù)據(jù),所述訓(xùn)練數(shù)據(jù)中包含多個(gè)訓(xùn)練樣本與各訓(xùn)練樣本對應(yīng)的標(biāo)簽;
使用訓(xùn)練數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)設(shè)次數(shù)的訓(xùn)練,并將各次訓(xùn)練過程中使用的訓(xùn)練樣本及其對應(yīng)的輸出結(jié)果作為緩存數(shù)據(jù),記錄到緩存中;
在訓(xùn)練次數(shù)超過預(yù)設(shè)次數(shù)之后,使用訓(xùn)練數(shù)據(jù)與緩存中的緩存數(shù)據(jù)對所述神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,并將各次訓(xùn)練過程中使用的訓(xùn)練樣本及其對應(yīng)的輸出結(jié)果作為緩存數(shù)據(jù),記錄到緩存中;
在確定所述神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練達(dá)到終止條件的情況下,完成所述神經(jīng)網(wǎng)絡(luò)模型的自訓(xùn)練;
其中,所述將各次訓(xùn)練過程中使用的訓(xùn)練樣本及其對應(yīng)的輸出結(jié)果作為緩存數(shù)據(jù),記錄到緩存中包括:
針對緩存數(shù)據(jù)中的同一個(gè)訓(xùn)練樣本,使用本次訓(xùn)練過程中得到的輸出結(jié)果替換前次訓(xùn)練過程中得到的輸出結(jié)果。
【案例一】分析如下:
獨(dú)立權(quán)利要求中的解決方案主要是通過采用創(chuàng)建緩存,將神經(jīng)網(wǎng)絡(luò)模型在各次訓(xùn)練過程中使用的訓(xùn)練樣本及其對應(yīng)的輸出結(jié)果作為緩存數(shù)據(jù)進(jìn)行記錄的技術(shù)手段,克服現(xiàn)有技術(shù)中在每次訓(xùn)練過程中需要對數(shù)據(jù)進(jìn)行增廣以及對增廣數(shù)據(jù)進(jìn)行預(yù)測所導(dǎo)致的時(shí)間成本較高、步驟較為繁瑣的技術(shù)問題,實(shí)現(xiàn)了減少對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行自訓(xùn)練時(shí)需要的時(shí)間成本,提升了對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行自訓(xùn)練的效率的技術(shù)效果。該方案涉及神經(jīng)網(wǎng)絡(luò)模型,雖然對涉及到的訓(xùn)練數(shù)據(jù)并沒有具體的應(yīng)用領(lǐng)域的限定,但是訓(xùn)練過程中涉及到創(chuàng)建緩存并記錄數(shù)據(jù),該過程與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)果存在特定的技術(shù)關(guān)聯(lián),且整體的訓(xùn)練過程降低了計(jì)算機(jī)在訓(xùn)練模型時(shí)的自訓(xùn)練時(shí)間成本,從而達(dá)到提升神經(jīng)網(wǎng)絡(luò)模型的自訓(xùn)練效率這一符合自然規(guī)律的涉及計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果。
故而,此案在審查過程中通過了客體的審查關(guān)口,并且最終得到授權(quán)。
案例二
背景技術(shù):
當(dāng)固定采用某一種模型訓(xùn)練方案,會使得處理器的資源不能很好的被調(diào)用,從而使得計(jì)算機(jī)的運(yùn)行效率比較低。
權(quán)利要求1 如下:
1.一種訓(xùn)練方法,包括:
當(dāng)訓(xùn)練數(shù)據(jù)的大小發(fā)生改變時(shí),針對改變后的訓(xùn)練數(shù)據(jù),分別計(jì)算所述改變后的訓(xùn)練數(shù)據(jù)在預(yù)設(shè)的至少兩個(gè)候選訓(xùn)練方案中的訓(xùn)練耗時(shí);
從預(yù)設(shè)的至少兩個(gè)候選訓(xùn)練方案中選取訓(xùn)練耗時(shí)最小的訓(xùn)練方案作為所述改變后的訓(xùn)練數(shù)據(jù)的最佳訓(xùn)練方案;所述至少兩個(gè)候選訓(xùn)練方案包括至少一個(gè)單處理器方案,至少一個(gè)基于數(shù)據(jù)并行的多處理器方案;
將所述改變后的訓(xùn)練數(shù)據(jù)在所述最佳訓(xùn)練方案中進(jìn)行模型訓(xùn)練。
【案例二】分析如下:
獨(dú)立權(quán)利要求中的解決方案主要是在訓(xùn)練數(shù)據(jù)大小發(fā)生變化時(shí),通過計(jì)算采用變化后的訓(xùn)練數(shù)據(jù)在至少兩個(gè)訓(xùn)練方案中的訓(xùn)練耗時(shí)來選擇最佳訓(xùn)練方案,并將改變后的訓(xùn)練數(shù)據(jù)在最佳訓(xùn)練方案中進(jìn)行模型訓(xùn)練,其中,最佳訓(xùn)練方案包括單處理器方案以及多處理器方案。整個(gè)步驟整體上是圍繞當(dāng)數(shù)據(jù)發(fā)生變化,如何對單、多處理器方案進(jìn)行更好的調(diào)度,使得計(jì)算機(jī)的運(yùn)行效率更高。該方案涉及到模型訓(xùn)練,雖然對涉及到的訓(xùn)練數(shù)據(jù)并沒有具體的應(yīng)用領(lǐng)域的限定,但是訓(xùn)練過程中涉及到根據(jù)訓(xùn)練耗時(shí)控制對單處理器訓(xùn)練方案、多處理器訓(xùn)練方案進(jìn)行更好的調(diào)度,該過程與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)存在特定的技術(shù)關(guān)聯(lián),且整體的訓(xùn)練過程降低了計(jì)算機(jī)在訓(xùn)練模型時(shí)的耗時(shí),從而達(dá)到提升計(jì)算機(jī)的運(yùn)行效率這一符合自然規(guī)律的涉及計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果。
故而,此案在審查過程中通過了客體的審查關(guān)口,并且最終得到授權(quán)。
案例三
背景技術(shù):
在實(shí)際應(yīng)用中,經(jīng)常需要檢測業(yè)務(wù)數(shù)據(jù)是否為異常數(shù)據(jù)。為此可以訓(xùn)練模型,進(jìn)而可以通過訓(xùn)練的模型檢測業(yè)務(wù)數(shù)據(jù)是否為異常數(shù)據(jù)。因此,如何提高模型的訓(xùn)練效果是當(dāng)前亟需解決的技術(shù)問題。
權(quán)利要求1 如下:
1.一種模型訓(xùn)練方法,包括:
獲取訓(xùn)練樣本集,所述訓(xùn)練樣本集包括無標(biāo)簽樣本集和有標(biāo)簽樣本集,所述無標(biāo)簽樣本集包括多個(gè)第一樣本,所述有標(biāo)簽樣本集包括多個(gè)第二樣本和類型標(biāo)簽,所述類型標(biāo)簽用于表示所述有標(biāo)簽樣本集中是否包含異常的第二樣本;
根據(jù)所述無標(biāo)簽樣本集,對第一模型進(jìn)行訓(xùn)練,所述第一模型包括特征提取子模型;
根據(jù)所述有標(biāo)簽樣本集和特征提取子模型的訓(xùn)練結(jié)果,對第二模型進(jìn)行訓(xùn)練,所述第二模型包括特征提取子模型和異常數(shù)據(jù)檢測子模型,所述異常數(shù)據(jù)檢測子模型用于根據(jù)特征提取子模型的輸出檢測異常數(shù)據(jù)。
【案例三】分析如下:
獨(dú)立權(quán)利要求的解決方案主要是通過無標(biāo)簽樣本集對第一模型進(jìn)行訓(xùn)練,可以實(shí)現(xiàn)對第二模型的部分模型參數(shù)進(jìn)行無監(jiān)督的預(yù)訓(xùn)練,進(jìn)而通過有標(biāo)簽樣本集實(shí)現(xiàn)對第二模型的模型參數(shù)進(jìn)行有監(jiān)督的再次訓(xùn)練。這樣便于利用大量的無標(biāo)簽樣本,并結(jié)合相對少量的有標(biāo)簽樣本,實(shí)現(xiàn)對第二模型的模型參數(shù)進(jìn)行訓(xùn)練,有利于提高第二模型的訓(xùn)練效果。整個(gè)解決方案中涉及模型訓(xùn)練上的改進(jìn),屬于涉及人工智能領(lǐng)域的算法改進(jìn),雖然對涉及到的無標(biāo)簽樣本和有標(biāo)簽樣本以及模型并沒有具體技術(shù)領(lǐng)域的限定,但是從實(shí)質(zhì)分析來看其通過這樣的訓(xùn)練方式的改進(jìn),提高了計(jì)算機(jī)訓(xùn)練第二模型的訓(xùn)練效果,能夠解決計(jì)算機(jī)提升執(zhí)行效果的技術(shù)問題,從而使得計(jì)算機(jī)系統(tǒng)內(nèi)部性能得到了改進(jìn)。
故而,此案在審查過程中通過了客體的審查關(guān)口,并且最終得到授權(quán)。
案例四
背景技術(shù):
目前在機(jī)器學(xué)習(xí)的過程中,對訓(xùn)練樣本數(shù)據(jù)的需求量巨大,并且需要對大量的訓(xùn)練樣本數(shù)據(jù)進(jìn)行標(biāo)注,傳統(tǒng)技術(shù)中通常需要人工對大量的訓(xùn)練樣本數(shù)據(jù)進(jìn)行標(biāo)注,使得標(biāo)注工作過分依賴于人,并且工作量巨大,標(biāo)注的效率較低。
公開版本的權(quán)利要求1 如下:
1.一種數(shù)據(jù)標(biāo)注的方法,其特征在于,所述方法包括:
通過預(yù)先訓(xùn)練的目標(biāo)標(biāo)注模型對多個(gè)待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注,得到由所述待標(biāo)注數(shù)據(jù)對應(yīng)的標(biāo)注結(jié)果構(gòu)成的目標(biāo)集合;
利用預(yù)先訓(xùn)練的目標(biāo)分類器選取所述待標(biāo)注數(shù)據(jù)中的非可信數(shù)據(jù),以驗(yàn)證所述非可信數(shù)據(jù)對應(yīng)的標(biāo)注結(jié)果;
更正所述目標(biāo)集合中未通過驗(yàn)證的非可信數(shù)據(jù)所對應(yīng)的標(biāo)注結(jié)果。
授權(quán)版本的權(quán)利要求1 如下:
1.一種數(shù)據(jù)標(biāo)注的方法,其特征在于,所述方法包括:
通過預(yù)先訓(xùn)練的目標(biāo)標(biāo)注模型對多個(gè)待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注,得到由所述待標(biāo)注數(shù)據(jù)對應(yīng)的標(biāo)注結(jié)果構(gòu)成的目標(biāo)集合;
利用預(yù)先訓(xùn)練的目標(biāo)分類器選取所述待標(biāo)注數(shù)據(jù)中的非可信數(shù)據(jù),以驗(yàn)證所述非可信數(shù)據(jù)對應(yīng)的標(biāo)注結(jié)果;
更正所述目標(biāo)集合中未通過驗(yàn)證的非可信數(shù)據(jù)所對應(yīng)的標(biāo)注結(jié)果,并將經(jīng)過更正的目標(biāo)集合存放入預(yù)先建立的標(biāo)注數(shù)據(jù)庫中,利用所述標(biāo)注數(shù)據(jù)庫對所述目標(biāo)標(biāo)注模型進(jìn)行更新;
其中,所述待標(biāo)注數(shù)據(jù)用于作為機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù),所述標(biāo)注結(jié)果用于作為機(jī)器學(xué)習(xí)的所述訓(xùn)練樣本數(shù)據(jù)的標(biāo)注。
【案例四】分析如下:
案例四的解決方案主要是通過訓(xùn)練好的目標(biāo)標(biāo)注模型對多個(gè)待標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注后,又利用目標(biāo)分類器篩選出更有可能標(biāo)注錯誤的待標(biāo)注數(shù)據(jù)進(jìn)行抽檢,并對錯誤的標(biāo)注結(jié)果進(jìn)行更正。從而使得標(biāo)注工作無需完全依賴于人,節(jié)省了大量的人力資源,提高了標(biāo)注的效率。同時(shí),能夠更有針對性的驗(yàn)證被標(biāo)注數(shù)據(jù)的結(jié)果,提高了標(biāo)注的準(zhǔn)確度。
此案在審查過程中經(jīng)歷了三次審查意見,其中一通的審查意見中明確指出了公開版本的獨(dú)立權(quán)利要求不符合A2.2的規(guī)定,后面的二通和三通指出的是有關(guān)新穎性和創(chuàng)造性的問題?;谠摰谝淮螌彶橐庖娡ㄖ獣囊庖?,筆者找到了如上的授權(quán)版本,授權(quán)版本獨(dú)立權(quán)利要求中增加了“并將經(jīng)過更正的目標(biāo)集合存放入預(yù)先建立的標(biāo)注數(shù)據(jù)庫中,利用所述標(biāo)注數(shù)據(jù)庫對所述目標(biāo)標(biāo)注模型進(jìn)行更新;其中,所述待標(biāo)注數(shù)據(jù)用于作為機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù),所述標(biāo)注結(jié)果用于作為機(jī)器學(xué)習(xí)的所述訓(xùn)練樣本數(shù)據(jù)的標(biāo)注”。
結(jié)合授權(quán)后的版本,筆者分析國家知識產(chǎn)權(quán)局的審查思路大致如下,授權(quán)后獨(dú)立權(quán)利要求的解決方案中明確了“所述待標(biāo)注數(shù)據(jù)用于作為機(jī)器學(xué)習(xí)的訓(xùn)練樣本數(shù)據(jù),所述標(biāo)注結(jié)果用于作為機(jī)器學(xué)習(xí)的所述訓(xùn)練樣本數(shù)據(jù)的標(biāo)注”,該特征主要明確了獨(dú)立權(quán)利要求的解決方案涉及機(jī)器學(xué)習(xí)領(lǐng)域,雖然其對涉及到的待標(biāo)注數(shù)據(jù)或者訓(xùn)練樣本數(shù)據(jù)并沒有具體的應(yīng)用領(lǐng)域的限定,但是從“并將經(jīng)過更正的目標(biāo)集合存放入預(yù)先建立的標(biāo)注數(shù)據(jù)庫中,利用所述標(biāo)注數(shù)據(jù)庫對所述目標(biāo)標(biāo)注模型進(jìn)行更新”這一特征上明確了預(yù)先建立了標(biāo)注數(shù)據(jù)庫,并調(diào)用標(biāo)注數(shù)據(jù)庫對模型進(jìn)行更新,而這一過程必然與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)存在特定的技術(shù)關(guān)聯(lián),且利用更新后的目標(biāo)標(biāo)注模型對數(shù)據(jù)進(jìn)行標(biāo)注的過程,達(dá)到了提升計(jì)算機(jī)對數(shù)據(jù)進(jìn)行標(biāo)注的效率這一符合自然規(guī)律的涉及計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果,故此案在審查過程中通過了客體的審查關(guān)口,并且最終得到授權(quán)。
案例五
背景技術(shù):
數(shù)據(jù)清洗是指發(fā)現(xiàn)并糾正數(shù)據(jù)中的錯誤的一道程序,其任務(wù)是過濾掉不符合要求的數(shù)據(jù)。一般來說,數(shù)據(jù)清理是對清洗前的數(shù)據(jù)進(jìn)行精簡以得到清洗后的數(shù)據(jù)的過程。現(xiàn)有的數(shù)據(jù)清洗通常需要數(shù)據(jù)清洗人員手工實(shí)現(xiàn),通過人工檢查,逐個(gè)驗(yàn)證數(shù)據(jù)。
權(quán)利要求1 如下:
獲取待清洗的訓(xùn)練樣本集合;
基于所述訓(xùn)練樣本集合,對初始模型進(jìn)行有監(jiān)督訓(xùn)練得到包括特征提取層的模型;
采用所述特征提取層提取所述訓(xùn)練樣本集合中的訓(xùn)練樣本的特征數(shù)據(jù);
對所得到的特征數(shù)據(jù)進(jìn)行聚類處理,以確定所述訓(xùn)練樣本集合中孤立的訓(xùn)練樣本;
基于所確定出的孤立的訓(xùn)練樣本,對所述訓(xùn)練樣本集合進(jìn)行清洗,得到清洗后的訓(xùn)練樣本集合,以及利用所述清洗后的訓(xùn)練樣本集合重新對所述初始模型進(jìn)行有監(jiān)督訓(xùn)練。
【案例五】分析如下:
獨(dú)立權(quán)利要求的解決方案主要是通過采用訓(xùn)練得到的特征提取層提取訓(xùn)練樣本的特征數(shù)據(jù)并進(jìn)行聚類處理以得到孤立訓(xùn)練樣本,并采用該孤立的樣本對訓(xùn)練樣本集合進(jìn)行清洗,得到清洗后的訓(xùn)練樣本集合,進(jìn)而無需人工清洗,豐富了數(shù)據(jù)清洗的方式,提高數(shù)據(jù)清洗的效率和準(zhǔn)確性,進(jìn)而提高了模型訓(xùn)練的準(zhǔn)確性和效率。該方案涉及到有監(jiān)督訓(xùn)練、聚類處理等人工智能算法,雖然對涉及到的訓(xùn)練樣本并沒有具體的應(yīng)用領(lǐng)域的限定,但是基于孤立的訓(xùn)練樣本對原來的訓(xùn)練樣本集合進(jìn)行清洗,該清洗過程與計(jì)算機(jī)系統(tǒng)的內(nèi)部結(jié)構(gòu)存在特定的技術(shù)關(guān)聯(lián),且整體的清洗過程降低了人工清洗的成本,節(jié)約了數(shù)據(jù)清洗的耗時(shí),達(dá)到了提高計(jì)算機(jī)清洗數(shù)據(jù)的效率和準(zhǔn)確性,使得計(jì)算機(jī)進(jìn)行模型訓(xùn)練的效果得到提升,提升了計(jì)算機(jī)系統(tǒng)內(nèi)部性能改進(jìn)的技術(shù)效果,故此案在審查過程中通過了客體的審查關(guān)口,并且最終得到授權(quán)。
結(jié)合以上案例,讀者應(yīng)該可以清晰地看到國家知識產(chǎn)權(quán)局對AI算法類案件進(jìn)行客體審查的過程中,已經(jīng)逐漸的在放松客體審查的關(guān)口,并已逐步在利用《專利審查指南修改草案(征求意見稿)》中所補(bǔ)充的有關(guān)人工智能算法的改進(jìn)方案的審查基準(zhǔn),這對于眾多的創(chuàng)新主體在AI算法上的創(chuàng)新無疑是非常利好的導(dǎo)向。