歡迎閱讀麥仕奇關於數據在專利制度中的性質和作用的新系列文章。本文旨在作為該系列的引言,解釋數據為何如此重要,並讓讀者對今後文章的內容有所瞭解。本文本身並不打算回答任何問題,也不打算提供建議——讀者們需要等待本系列文章的其他部分!不過,我們希望本文能夠充分揭示我們將要涉及的關鍵主題,並讓讀者對未來的文章充滿期待。
自專利制度誕生之初,在授予有限的壟斷權(如美國憲法所言,這是“為了促進科學和實用藝術的發展”所必需的),與過度獎勵創造者和發明者從而造成壟斷權過度的潛在抑制效應之間,就一直存在矛盾。這種矛盾通常表現為以公開發明來換取壟斷權的基本專利交換。
但“公開”是什麼意思呢?相關法規(例如《歐洲專利公約》第83條或美國專利法35 U.S.C. 112)並沒有給出明確的解釋。“說明書應包含對發明、製造和使用方式及過程的書面描述,其用詞應全面、清晰、簡潔、準確,以便使所屬領域或最接近相關領域的任何技術人員能夠製造和使用該發明為准”;或者“歐洲專利申請應以足夠清晰和完整的方式公開發明,以便所屬領域技術人員能夠實施該發明為准”。在實踐中,一般的要求是在涵蓋權利要求書的範圍內,公開的內容應足夠充分,或能夠實現。也就是說,如果申請人要求保護棍子上的月亮,那麼公開的內容必須能夠讓讀者實際獲得棍子上的月亮。相反,如果申請人只要求保護棍子,那麼只需要公開棍子的來源即可。
數據的使用取決於發明的性質,以及相關的技術領域。這與生命科學最為相關。例如,要保護一項簡單的機械發明,可能不需要包含說明該機械工作原理的數據,只要它能夠製造出來即可。(當然,如果是永動機則必須符合物理定律)。另一方面,如果發明涉及聲稱具有特定功能的多種分子或治療藥物,則可能需要數據來證明可以獲得此類分子,並且同一類別的其他未公開分子也具有該功能。
多年來,對所需數據範圍的要求時高時低。最初,美國專利商標局(USPTO)要求發明人不僅提交專利說明書,還要提交實物模型(可能具有功能性)。顯然,由於空間有限以及技術已不再局限於純粹的機械領域,這種做法無法持續。1873年,路易斯·巴斯德獲得了“不含有機致病菌的酵母”的專利。當時公開的這份專利是否足以製備任何類型的酵母,而不僅僅是釀造酵母?從20世紀90年代開始,基因組數據在短時間內激增,導致許多公司提交了包含數千個短DNA序列(EST)的專利申請,但除了聲稱這些序列可能可以作為探針(probes)使用之外,幾乎沒有數據表明它們可以如何被使用。這些專利申請中的許多都石沉大海,但它們確實凸顯了USPTO和EPO(歐洲專利局)在實踐中的關鍵分歧。
美國最高法院最近有關安進公司(Amgen)的判決,凸顯了當前存在的另一個分歧——該決定的要點是,在美國,就算是公開了生成和選擇更多抗體的方案,但是如果只公開抗體靶點和幾種抗體的話,可能不足以對針對該靶點的任何抗體提出寬泛的權利要求。相比之下,歐洲專利局目前的立場是,針對特定靶點產生抗體是常規操作,因此應當認為是充分公開(但是,如果沒有進一步的特徵,則可能不具備創造性——這是歐洲專利局常見的攻擊手段,即不那麼宏偉的技術問題可以避免被認為公開不充分,但是會落入存在創造性缺陷的範疇)。
雖然基本要求是專利或申請本身必須充分公開發明,但在許多司法管轄區,提交申請後數據來支持原始公開是可能的。這當然引起了媒體的廣泛關注,因為歐洲專利局和國家法院最近一直在處理所謂的發明合理性(Plausibility)問題,最終導致歐洲專利局擴大上訴委員會最近做出了G2/21號決定。不同國家對於接受申請後數據的處理方式,可能會給粗心大意的人帶來風險。在評估第二醫療用途的專利時,這一點也很關鍵,因為已知藥物可能會用於治療新的適應症。顯然,製造已知藥物本身沒有問題,但要想獲得專利,需要滿足哪些條件才能令人信服地證明其具有新的治療效果呢?
數據當然不僅僅包括實驗數據。在當今大數據和機器學習的當今時代,需要考慮的新問題層出不窮。如果一項發明僅通過挖掘龐大的數據集獲得,那麼它是否滿足足夠公開的要求?人工智能生成的數據可以發揮什麼作用?隨著機器學習模型在預測蛋白質折疊和人工智能指導的藥物發現方面的興起,需要什麼樣的數據來支持這些預測?當有可能根據目標蛋白質序列生成數千個抗體序列時,美國專利商標局能否維持其針對抗體專利的後Amgen判決的做法?在某種程度上,這可以從現有假設實例的實踐中得到啟發——這些實例基於對未來結果的專家預測(一項關於“預言數據”的研究估計,美國生物和化學專利數據集中的“至少17%的實驗”是虛構的)。當然,還有一個更模糊的問題,即完全憑空捏造的數據會怎樣,無論它們是源於錯誤的假設還是錯誤的預言——雖然科學出版物顯然存在“論文工廠”的問題,但專利申請是否會遭遇類似問題?
我們即將推出的系列文章將探討所有這些問題,以及更多內容,請繼續關注我們的新的文章,我們將繼續研究數據在專利領域所扮演的角色。