קאָמפּיוטערס, ווייכווארג
אַוואַנסירטע זוכן און אָנפֿרעג שפּראַך. שפּראַך זוכן מאָטאָר קוויריז
אָנפֿרעג שפּראַך - איז אַרטיפיסיאַללי Created by די פּראָגראַממינג שפּראַך געניצט צו אָנפֿרעג דאַטאַבייסיז און אינפֿאָרמאַציע סיסטעמס.
אין אַלגעמיין, אַזאַ מעטהאָדס פון קוויריז קענען זיין קלאַססיפיעד דיפּענדינג אויף צי זיי זענען געניצט פֿאַר די דייטאַבייס, אָדער זוכן פֿאַר אינפֿאָרמאַציע. די חילוק איז אַז די ריקוועס פֿאַר אַזאַ באַדינונגען זענען באגאנגען צו צושטעלן פאַקטואַל ענטפֿערס צו די שאלות, בשעת די זוכן מאָטאָר טרייז צו געפינען דאקומענטן מיט אינפֿאָרמאַציע רילייטינג צו דער באַניצער איז אינטערעסירט אין די פעלד.
דאַטאַבייסיז
שפּראַכן פון דייטאַבייס קוויריז אַרייַננעמען די ווייַטערדיק יגזאַמפּאַלז:
- קל - אַ כייפעץ-אָריענטיד, רעפערס צו ריליישאַנאַל דאַטאַבייסיז; דאַטאַלאָג סאַקסעסער.
- קאָנטעקסט (קקל) - די פאָרמאַל שפּראַך פון די פּרעזענטירונג פון ריקוועס פֿאַר אינפֿאָרמאַציע ריטריוואַל סיסטעמס (אַזאַ ווי וועב ינדעקסיז אָדער ביבליאָגראַפיק קאַטאַלאַגז).
- קקלף (קאָדיאַסיל) - פֿאַר קאָדאַסיל-טיפּ דאַטאַבייסיז.
- באַגריף-אָריענטאַד אָנפֿרעג שפּראַך (קאָקל) - געניצט אין די ריספּעקטיוו מאָדעלס (קאַם). עס איז באזירט אויף דאַטן קאָנסטרופּט מאָדעלינג פּרינציפּן און ניצט אַפּעריישאַנז אַזאַ ווי פּרויעקציע און דע פּרויעקציע פון אַ מולטיוואַריאַטע אַנאַליסיס, אַנאַליטיקאַל אַפּעריישאַנז און קאַנקלוזשאַנז.
- דמקס - געניצט אין די מיינינג מאָדעל.
- דאַטאַלאָג - אַ אָנפֿרעג שפּראַך פֿאַר דעדוקטיווע דאַטאַבייסיז.
- געלליש ענגליש - אַ שפּראַך וואס קענען ווערן געניצט צו אָנפֿרעג די דייטאַבייס אין געלליש ענגליש און אַלאַוז שמועסן (ריקוועס און רעספּאָנסעס), און אויך סערוועס צו אינפֿאָרמאַציע מאָדעלינג וויסן.
- הצקל - איבערזעצט דעם הטטפּ-קוויריז אין סקל.
- יסבל - געניצט צו פּרטוו (אַ ערשטער ריליישאַנאַל דייטאַבייס פאַרוואַלטונג סיסטעמס).
- לדאַפּ - אַ פּראָטאָקאָל פֿאַר קוועריינג און Directory סערוויסעס פליסנדיק איבער טקפּ / יפּ פּראָטאָקאָל.
- מדקס - יקערדיק פֿאַר אָלאַפּ דאַטאַבייסיז.
באָץ
שפּראַך זוכן קוויריז, אין דרייען, יימז צו געפינען די דאַטע אין דער זוכן ענדזשאַנז. עס איז קעראַקטערייזד דורך די פאַקט אַז טייל פון די בעטן אַנטהאַלטן קלאָר טעקסט אָדער היפּערטעקסט מיט אַפּשאַנאַל סינטאַקס (למשל, "און" / "אָדער"). עס דיפפערס באטייטיק פון די סטאַנדאַרט פון ענלעך שפּראַכן, וואָס זענען גאַווערנד דורך שטרענג כּללים פון סינטאַקס אָדער קאַמאַנדז אַנטהאַלטן פּאָסיטיאָנאַל פּאַראַמעטערס.
ווי קלאַססיפיעד זוכן קוויריז?
עס זענען דרייַ ברייט קאַטעגאָריעס אַז דעקן די מערהייַט פון אָנפֿרעגן: ינפאָרמאַטיאָנאַל, נאַוואַגיישאַנאַל, און טראַנסאַקטיאָנאַל. כאָטש דעם גריידינג איז געווען ניט פאַרפעסטיקט טיערעטיקאַלי, עמפּיריקלי עס איז באשטעטיקט דורך די בייַזייַן פון די פאַקטיש קוויריז אין זוכן ענדזשאַנז.
אינפֿאָרמאַציע ריקוועס - יענע אַז דעקן ברייט סוגיות (למשל, אַ ספּעציפיש שטאָט אָדער אַ מאָדעל טראַקס), אין רעספּעקט פון וואָס קענען זיין באקומען טויזנטער פון באַטייַטיק רעזולטאטן.
נאַוויגאַציע - עס ריקוועס אַז זענען קוקן פֿאַר אַ וועבזייַטל אָדער אַ וועב בלאַט אויף אַ באַזונדער טעמע (למשל, יאָוטובע).
טראַנסאַקטיאָנאַל - פאַרטראַכטנ זיך דעם באַניצער 'ס כוונה צו דורכפירן אַ ספּעציפיש קאַמף, למשל, צו קויפן אַ מאַשין אָדער בוך אַ פלי.
זוכן ענדזשאַנז אָפֿט צושטעלן 1/4 טיפּ פון בעטן אַז איז געניצט פיל ווייניקער אָפט. דעם אַזוי-גערופֿן קשר ריקוועס אַז אַנטהאַלטן אַ רעקאָרד פון די קאַנעקטיוויטי ינדעקסט וועב graphics (נומער פון לינקס צו די URL Defined, אָדער ווי פילע בלעטער זענען ינדעקסט מיט אַ באַזונדער פעלד).
ווי צו מאַכן שאַרף פֿאַר אינפֿאָרמאַציע?
רובֿ זוכן רעסורסן טוט נישט ויסזאָגן זייַן זוכן לאָגס, אַזוי די אינפֿאָרמאַציע אַז ניצערס זענען שאַרף פֿאַר אויף די וועב, עס איז זייער שווער צו געפֿינען. דאך, די ערשטער SCIENTIFIC שטודיום ארויס אין 1998. עס איז געווען שפּעטער שייַעך-לערנען געטראגן אויס אין 2001, וואָס אַנאַלייזד די ריקוועס דערשייַנען ווי העכסט באַטייַטיק. עס אויך איז געווארן קלאָר ווי צו נוצן זוכן ענדזשאַנז אָנפֿרעג שפּראַך.
זיי איז געווארן באקאנט צו די טשיקאַווע טשאַראַקטעריסטיקס שייך צו וועב:
די דורכשניטלעך לענג איז געווען 2.4 זוכן אָנפֿרעג ווערטער.
- וועגן האַלב פון די מענטשן זענען געשיקט אַ בקשה, אָבער אַ ביסל ווייניקער ווי אַ דריט פון ניצערס טאָן דרייַ אָדער מער יינציק קוויריז איינער דורך איינער.
- כּמעט העלפט פון די ניצערס צו מיינונג בלויז דער ערשטער איינער אָדער צוויי בלעטער פון די רעזולטאטן.
- ווייניקער ווי 5% פון ניצערס נוצן אַוואַנסירטע זוכעניש קייפּאַבילאַטיז (למשל, די ברירה פון קיין באַזונדער קאַטעגאָריעס אָדער זוכן אין דער זוכן).
פֿעיִקייטן מנהג אַקשאַנז
די לערנען אויך געוויזן אַז 19% פון די ריקוועס קאַנטיינד געאָגראַפֿיש טערמין (למשל, נעמען, פּאָוסטאַל קאָודז, Geographic פֿעיִקייטן, און אַזוי אויף. ד). אבער עס איז כדאי צו באמערקן אַז אין דערצו צו קורץ קוויריז (ד"ה מיט קייפל טנאָים) איז אָפֿט פאָרשטעלן און פּרידיקטאַבאַל פּאַטערנז אין וואָס ניצערס טוישן זייער זוכן קרעם.
עס איז אויך אויס אַז 33% פון ריקוועס פון איין באַניצער זענען ריפּיטיד, און אין 87% פון קאַסעס דער באַניצער וועט דריקן דער זעלביקער רעזולטאַט. דעם סאַגדזשעסץ אַז פילע ניצערס נוצן די ריפּיטיד ריקוועס צו רעצענזיע אָדער שייַעך-געפינען אינפֿאָרמאַציע.
די אָפטקייַט פאַרשפּרייטונג פון ריקוועס
אין דערצו, די עקספּערץ באשטעטיקט אַז די אָפטקייַט פון פאַרשפּרייטונג ריקוועס שטימען צו אַ מאַכט געזעץ. אַז איז, אַ קליין חלק פון די קיווערד אַקערז אין דעם גרעסטן רשימה פון קוויריז (למשל, מער ווי 100 מיליאָן), און זיי זענען רובֿ אָפֿט געניצט. די מנוחה פון דעם זאַץ אונטער דער זעלביקער סאַבדזשעקס זענען געניצט ווייניקער אָפט און מער ינדיווידזשואַלי. דעם דערשיינונג איז גערופֿן די פּאַרעטאָ פּרינציפּ (אָדער "80-20 הערשן"), און עס איז מעגלעך צו נוצן אַזאַ זוכן ענדזשאַנז אַפּטאַמאַזיישאַן טעקניקס ווי ינדעקסינג אָדער פּאַרטישאַנינג די דייטאַבייס, קאַטשינג און preloading, און אויך צוגעשטעלט אַ געלעגנהייט צו פֿאַרבעסערן די שפּראַך פון זוכן מאָטאָר קוויריז.
אין לעצטע יאָרן, עס האט שוין גילוי אַז די דורכשניטלעך אָנפֿרעג לענג איז סטעדאַלי ינקריסינג איבער צייַט. אזוי, דער דורכשניטלעך בעטן אין ענגליש איז געווארן מער. אין דעם אַכטונג, גוגל האט באַקענענ די דערהייַנטיקן געהייסן "הוממינגבירד" (אויגוסט 2013), וואָס איז ביכולת צו שעפּן לאַנג זוכן פֿראַזעס מיט קיין פּראָטאָקאָל "גערעדט" אָנפֿרעג שפּראַך (אַזאַ ווי "וואו איז די ניראַסט קאַווע קראָם?").
פֿאַר מער קוויריז נוצן זייער פּראַסעסינג - זיי זענען צעבראכן אַראָפּ אין פֿראַזעס, אַרטיקיאַלייטאַד נאָרמאַל שפּראַך, און דיספּלייז די ענטפֿערס צו די פאַרשידענע טיילן סעפּעראַטלי.
סטראַקטשערד קווערי
זוכן ענדזשאַנז אַז שטיצן די לאַדזשיקאַל אָפּעראַציע און די סינטאַקס געניצט איבער עקסטענדעד אָנפֿרעג שפּראַכן. א באַניצער וואס איז קוקן פֿאַר דאקומענטן, קאַווערינג עטלעכע טעמעס אָדער פאַסעץ, קענען באַשרייַבן יעדער פון זיי אין אַ לאַדזשיקאַל כאראקטעריסטיק פון דעם וואָרט. ביי זייַן האַרץ, די לאַדזשיקאַל אָנפֿרעג שפּראַך איז אַ סכום פון ספּעציפיש פֿראַזעס און פּונקטואַציע.
וואָס איז אַוואַנסירטע זוכעניש?
שפּראַך "יאַנדעקס" און "גוגל" קוויריז קענען צו פירן אויס מער טאַרגעטעד זוכן, אונטער צו זיכער באדינגונגען. אַוואַנסירטע זוכעניש קענען זוכן די נאָמען פון די בלאַט אָדער נוצן דעם פּרעפֿיקס כעדער, ווי ווויל ווי אין זיכער קאַטעגאָריעס און רשימות פון נעמען. עס קענען אויך באַגרענעצן די זוכן צו בלעטער וואס אַנטהאַלטן ספּעציפיש ווערטער אין די טיטל אָדער אונטער זיכער טימאַטיק גרופּעס. ווען געוויינט ריכטיק, די אָנפֿרעג שפּראַך עס קענען שעפּן די פּאַראַמעטערס פון אַ סדר פון מאַגנאַטוד מער קאָמפּליצירט ווי די ייבערפלאַך פון די ישואַנס פון רובֿ זוכן ענדזשאַנז, כולל באַניצער-Defined ווערטער צו די סוף פון אַ בייַטעוודיק און די זעלבע אויסלייג. ווען סאַבמיטינג די יקספּאַנדאַד זוכן רעזולטאטן וועט זיין געוויזן ווי אַ לינק צו די באַטייַטיק סעקשאַנז פון די בלאַט.
עס איז אויך מעגלעך צו זוכן אַלע די בלעטער מיט אַ באַזונדער פראַזע, בשעת אין די נאָרמאַל אָנפֿרעג זוכן ענדזשאַנז קענען ניט וווינען אויף קיין רעדן בלאַט. אין פילע קאַסעס, די אָנפֿרעג שפּראַך קענען פירן צו קיין בלאַט, ליגן אין די נאָינדעקס טאַגס.
אין עטלעכע קאַסעס, געזונט-געגרינדעט בעטן אַלאַוז איר צו געפינען די אינפֿאָרמאַציע, מיט אַ נומער פון ספּעציעל אותיות און אותיות פון אנדערע אַלפאַבעץ (כינעזיש אותיות פֿאַר בייַשפּיל).
סימבאָלס אָנפֿרעג שפּראַך ווי צו לייענען?
אויבערשטער און נידעריקער פאַל, און עטלעכע דיאַקריטיקס (אַקסענץ און ומלאַוט) זענען נישט געהאלטן אין דער זוכן. למשל, אַ קיווערד זוכן פֿאַר סיטראָען וועט ניט געפֿינען בלעטער וואס אַנטהאַלטן די וואָרט "ציטראָאָן". אבער עטלעכע ליגאַטורעס שטימען צו יחיד אותיות. לעמאָשל, זוכן פֿאַר "Ærøskøbing" לייכט געפינען די בלאַט מיט אַ "ערעסקעבינג" (יי = יי).
פילע ניט-אַלפאַנומעריק אותיות זענען קעסיידער איגנאָרירט. פֿאַר משל, עס איז אוממעגלעך צו געפינען אינפֿאָרמאַציע פֿאַר קוויריז מיט די שטריקל | ל | (די בריוו צווישן צוויי ווערטיקאַל מלקות), טראָץ דעם פאַקט אַז דעם סימבאָל איז געניצט אין עטלעכע טעמפּלאַטעס צו בייַטן. דער רעזולטאַט וועט בלויז "לט" דאַטן. עטלעכע סימבאָלס און פֿראַזעס זענען כאַנדאַלד אין פאַרשידענע וועגן: די אָנפֿרעג "אַנטלייַען (Finance)" דיספּלייז די אַרטיקל מיט די ווערטער "קרעדיט" און "פינאַנצן", יגנאָרינג בראַקאַץ, אַפֿילו אויב עס איז אַן אַרטיקל מיט די פּינטלעך נאָמען "קרעדיט (Finance)".
עס זענען פילע אָפּציעס אַז איר קענען נוצן מיט די אָנפֿרעג שפּראַך.
סינטאַקס
אָנפֿרעג שפּראַך "יאַנדעקס" און "גוגל" קענען נוצן עטלעכע פּונקטואַציע מאַרקס צו ראַפינירן אייער זוכן. ווי אַ משל, געגרייַזלט ברייסאַז - {{}} זוכן. די פראַזע קאַנטיינד אין זיי, וועט זיין אונטער צו זוכן די גאנצע אַנטשיינדזשד.
די פראַזע אין טאָפּל ציטירט אַלאַוז איר צו דעפינירן די כייפעץ פון די זוכן. למשל, דער וואָרט אין ציטאַט מאַרקס וועט ווערן אנערקענט ווי געניצט אין אַ פיגוראַטיווע זינען, אָדער ווי אַ פיקטיאָנאַל כאַראַקטער, אָן די ציטאַט מאַרקס - די אינפֿאָרמאַציע איז מער דאַקיומענטערי כאַראַקטער.
אין דערצו, אַלע די הויפּט זוכן ענדזשאַנז שטיצן די "-" פֿאַר אַ לאַדזשיקאַל "קיין", ווי ווויל ווי און / אָדער. ויסנעם - ווערטער אַז קענען ניט זיין צעשיידט דורך אַ מאַקעף אָדער לאָך פּרעפֿיקס.
טוט ניט צופּאַסן די זוכן זאץ איז אנגעצייכנט מיט ~. למשל, אויב איר טאָן ניט געדענקען די פּינטלעך ווערדינג פון אַ טערמין אָדער נאָמען, איר קענען אַרייַן עס אין די זוכן באַר מיט די ספּעסיפיעד סימבאָל, און וועט קענען צו באַקומען רעזולטאַטן מיט מאַקסימום ענלעכקייַט.
די פּאַראַמעטערס פון די ספּעשאַלייזד זוכן
עס זענען אויך קרייטיריאַ ווי ינטיטלע, און ינקאַטעגאָרי. די Filters זענען געוויזן דורך די צווייפּינטל, ווי אַ "פילטער: די אָנפֿרעג שטריקל". די אָנפֿרעג שטריקל קענען אַנטהאַלטן די זוכן טערמין אָדער פראַזע, אָדער אַ טייל אָדער די פול נאָמען פון דעם בלאַט.
פֿונקציע «ינטיטלע: אָנפֿרעג" גיט בילכערקייַט צו די זוכן רעזולטאַטן דורך נאָמען, אָבער אויך ווייזט און די געוויינטלעך רעזולטאַטן אויף די צופרידן כעדער. עטלעכע פון די Filters קענען ווערן געניצט סיימאַלטייניאַסלי. ווי קענען אָנכאַפּן דעם געלעגנהייט?
אָנפֿרעג טיפּ «ינטיטלע: די נאָמען פון די אַעראָפּאָרט" וועט געבן אַלע ארטיקלען מיט דעם טיטל נאָמען פון די אַעראָפּאָרט. אויב מיר פאָרמולירן עס ווי אַ «פּאַרקינג ינטיטלע: אַעראָפּאָרט נאָמען", דעמאָלט איר וועט באַקומען די אַרטיקל מיט די נאָמען פון די אַעראָפּאָרט אין דעם טיטל און מיט די דערמאָנען פון פּאַרקינג אין די טעקסט.
זוכן פילטער «ינקאַטעגאָרי: קאַטעגאָריע" אַרבעט אויף די פּרינציפּ פון די ערשט ישואַנס פון די ארטיקלען בילאָנגינג צו אַ באַזונדער גרופּע אָדער בלאַט רשימה. למשל, אַ זוכן אָנפֿרעג פֿאַר דעם טיפּ פון "טעמפּלעס ינקאַטעגאָרי: געשיכטע" וועט פּראָדוצירן רעזולטאטן אויף דער געשיכטע פון די טעמפּלעס. דעם פֿונקציע קענען אויך זיין געוויינט ווי אַ פאַרלענגערונג, באַשטעטיקן פאַרשידן פּאַראַמעטערס.
Similar articles
Trending Now