Категории

Проза
- Проза
- Историческая проза
- Русская современная проза
- Советская классическая проза
- Повести
- Сентиментальная проза
- Зарубежная классика
- Рассказы
- Зарубежная современная проза
- Эпистолярная проза
- Афоризмы
- Очерки
- Разное
- Эссе
- Магический реализм
- Семейный роман/Семейная сага
- Феерия
- Антисоветская литература
- Новелла
- Русская классическая проза
- Современная проза
- О войне
- Контркультура
- Классическая проза
Любовные романы
- Любовные романы
- Исторические любовные романы
- Зарубежные любовные романы
- Эротика
- Слэш
- love
- Порно
- Роман
- Прочие любовные романы
- Фемслэш
- Остросюжетные любовные романы
- Современные любовные романы
- Короткие любовные романы
- Любовно-фантастические романы
Фантастика и фэнтези
- Социально-философская фантастика
- Социально-философская фантастика
- Социально-философская фантастика
- Детективная фантастика
- Киберпанк
- Попаданцы
- LitRPG
- Космоопера
- Технофэнтези
- Городская фантастика
- Русское фэнтези
- Юмористическая фантастика
- Космическая фантастика
- Разное фэнтези
- Городское фэнтези
- Стимпанк
- Мистика
- Боевое фэнтези
- Книги магов
- Разная фантастика
- Романтическая фантастика
- Эпическая фантастика
- Социально-философская фантастика
- Иностранное фэнтези
- Любовное фэнтези
- Сказочная фантастика
- Историческое фэнтези
- Зарубежная фантастика
- Романтическое фэнтези
- Историческая фантастика
- Ироническая фантастика
- Ироническое фэнтези
- Ужасы и Мистика
- Постапокалипсис
- Героическая фантастика
- Фэнтези
- Научная Фантастика
- Социально-психологическая
- Альтернативная история
- Боевая фантастика
Бизнес
- Личная эффективность
- О бизнесе популярно
- Малый бизнес
- Государственное и муниципальное управление
- Бизнес
- Личные финансы
- Менеджмент и кадры
- Экономика
- Управление, подбор персонала
- Банковское дело
- Ценные бумаги и инвестиции
- Корпоративная культура, бизнес
- Личная эффективность
- Поиск работы
- Интернет-бизнес
- Финансы
- Менеджмент
- Работа с клиентами
- Кадровый менеджмент
- Переговоры
- Краткое содержание
- Продажи
- Делопроизводство, офис
- Бухучет и аудит
- Тайм-менеджмент
- Зарубежная деловая литература
- Ораторское искусство / риторика
Справочная литература
- Энциклопедии
- Прочая справочная литература
- Словари
- Руководства
- Справочники
Приключения
- Путешествия и география
- Исторические приключения
- Прочие приключения
- Природа и животные
- Морские приключения
- Вестерн
- Приключения про индейцев
- Зарубежные приключения
Старинная литература
- Античная литература
- Зарубежная старинная литература
- Мифы. Легенды. Эпос
- Европейская старинная литература
- Древнерусская литература
- Древневосточная литература
- Фольклор
- Прочая старинная литература
Религия и духовность
- Религия: окультизм
- Бизнес
- Религия
- Эзотерика
- Прочая религиозная литература
- Самосовершенствование
- Православие
- Религия: христианство
- Религия: протестантизм
- Язычество, паганизм
- Буддизм
- Индуизм
- Зарубежная религиозная литература и эзотерика
- Религии: разное
- Религия: ислам
- Религия: иудаизм
Компьютеры и Интернет
- Прочая околокомпьтерная литература
- Программы
- Программное обеспечение
- Интернет
- Программирование
- Базы данных
- Компьютерное "железо"
Поэзия, Драматургия
- Драматургия
- Сценарии
- Драма
- Песенная поэзия
- Басни
- Киносценарии
- Кино, театр
- Зарубежная поэзия
- В стихах
- Бизнес
- Театр
- Лирика
- Трагедия
- Экспериментальная поэзия
- Верлибры
- Водевиль
- Мистерия
- Эпическая поэзия
- Поэзия
Детская литература
- Детская фантастика
- Детские остросюжетные
- Детские стихи
- Детские приключения
- Зарубежные детские книги
- Учебная литература
- Школьные учебники
- Детские детективы
- Внеклассное чтение
- Книги для дошкольников
- Детский фольклор
- Загадки
- Книги для подростков
- Детская познавательная и развивающая литература
- Прочая детская литература
- Сказка
- Детская проза
- Детская образовательная литература
Юмор
- Комедия
- Любовные романы
- Любовные романы
- Анекдоты
- Юмористическая проза
- Юмористическое фэнтези
- Юмористические стихи
- Драматургия
- Сатира
- Прочий юмор
Документальные книги
- Бизнес
- Бизнес
- Искусство и Дизайн
- Критика
- Публицистика
- Прочая документальная литература
- Военная документалистика
- Биографии и Мемуары
Научные и научно-популярные книги
- Шпаргалки
- Рефераты
- Экология
- Биофизика
- Культурология
- Юриспруденция
- Политика
- Языкознание
- Психотерапия
- Науки: разное
- Биология
- Медицина
- Научпоп
- Воспитание детей, педагогика
- Психология, личное
- Архитектура
- Образовательная литература
- Филология
- Физика
- Радиотехника
- География
- Деловая литература
- Детская психология
- Литературоведение
- Педагогика
- Альтернативная медицина
- Науки о космосе
- Ботаника
- Иностранные языки
- Государство и право
- Обществознание
- Беременность, ожидание детей
- Химия
- Учебники
- О животных
- Социология
- Математика
- Зарубежная психология
- Астрология
- Ветеринария
- География
- Зоология
- Биохимия
- Зарубежная публицистика
- История Европы
- Транспорт, военная техника
- Религиоведение
- История
- Техническая литература
- Прочая научная литература
- Психология
Разная литература
- Шахматы
- Зарубежная литература о культуре и искусстве
- Пословицы, поговорки
- Готические новеллы
- Гиды, путеводители
- Фанфик
- Визуальные искусства
- Военное
- Цитаты из афоризмов
- Истории из жизни
- Кино
- Военная история
- Литература 19 века
- Культура и искусство
- Музыка, музыканты
- Великолепные истории
- Зарубежная образовательная литература
- Современная зарубежная литература
- Отраслевые издания
- Начинающие авторы
- Зарубежная прикладная литература
- Авто и ПДД
- Музыка, танцы
- Изобразительное искусство, фотография
- Спецслужбы
- Недвижимость
- Современная литература
- Боевые искусства
- Подростковая литература
- Шахматы
- Прочее
- Военная техника, оружие
- Газеты и журналы
- Периодические издания
Домоводство, Дом и семья
- Ремонт в квартире
- Здоровье
- Спорт
- Домашние животные
- Кулинария
- Прочее домоводство
- Сад и огород
- Развлечения
- Дом, семья
- Отдых / туризм
- Интерьеры
- Рыбалка
- Охота
- Семейная психология
- Эротика, Секс
- Сделай сам
- Хобби и ремесла
Бизнес
- Маркетинг, PR, реклама
Детективы и Триллеры
- Юридический триллер
- Исторический детектив
- Детектив
- Триллер
- Боевик
- Криминальный детектив
- Полицейский детектив
- Иронический детектив
- Крутой детектив
- Маньяки
- Иностранный детектив
- Политический детектив
- Зарубежные боевики
- Дамский детективный роман
- Классический детектив
- Шпионский детектив
Бизнес
- Торговля
- Тайм-менеджмент
Любовные романы
Биографии
Блог

Меню

Самые читаемые

Выжившая из Ходо. Эльфийский турнир - Ольга Дмитриева

Мессалина. Трагедия императрицы - Ирена Гарда

Правила карьеры. Все, что нужно для служебного роста - Ричард Темплар

Пилот штрафной эскадрильи - Юрий Корчевский

PochitayKnigi » Компьютеры и Интернет » Прочая околокомпьтерная литература » Журнал «Компьютерра» № 11 от 20 марта 2007 года - Компьютерра

Журнал «Компьютерра» № 11 от 20 марта 2007 года - Компьютерра

Читать онлайн Журнал «Компьютерра» № 11 от 20 марта 2007 года - Компьютерра

Шрифт:

Интервал:

Закладка:

Сделать

1 ... 16 17 18 19 20 21 22 23 24 ... 26

Перейти на страницу:

- Системы датамайнинга устроены не так, как системы поиска по вебу (Google, Yahoo), поскольку датамайнинг работает обычно с цифровыми базами данных и задает другие вопросы, нежели Google. Обычно эти системы реализуют различные методы очистки и препроцессинга, а затем применяется основное ядро алгоритмов. Самые важные задачи, решаемые этими алгоритмами, - классификация, кластеризация, визуализация. Процесс датамайнинга требует множества итераций, как показано на рисунке. Важнейшая алгоритмическая часть - использование алгоритмов машинного обучения, то есть построение модели; для датамайнинговой системы это так же важно, как двигатель для спортивного автомобиля. Однако основные усилия обычно уходят на подготовку данных. Заинтересованных читателей приглашаю познакомиться с моими (свободно доступными) лекциями.

Кандидаты в великие

На конференции KDD-2006 несколько известных исследователей в области извлечения знаний из данных предложили задачи, которые в будущем могут претендовать на роль "великих вызовов", бросаемых повседневной практикой.

• Провести аннотацию 1000 Часов цифрового видео в течение одного часа. Согласно автору предложения Шабану Джерабе (Chabane Djeraba), в настоящее время это требует тысяч человеко-часов при ручной работе. Под аннотацией подразумевается краткое описание происходящего. Например, сегодня невозможно без выполненной человеком аннотации выделить в записи баскетбольного матча эпизоды атаки и обороны каждой команды. Ручная аннотация одной фотографии для Национального географического общества требует двадцать минут.

• ВикипедиЯя-тест (Lise Getoor, Лиз Гетур). По сборнику статей, созданному либо в режиме партисипативной журналистики (то есть по принципу наполнения Википедии), либо с использованием автоматических инструментов поиска линков по требуемой тематике, определить, какой из этих двух методов использовался: то есть составлен ли сборник машиной или людьми (и в каком случае качество оказалось выше)? Автор предложения указывает на связь этого вызова с другим, брошенным специалистам по сжатию информации: сжать 100 мегабайт Википедии до 18 мегабайт, не потеряв ни единого бита (за это уже назначен приз Хаттера в 50 тысяч долларов).

• Оценить миллиард прогнозирующих моделей (Robert Grossman, Роберт Гроссман). В ходе многолетней практики датамайнинга было построено великое множество статистических моделей для различных типов и конкретных ансамблей данных. Во многих случаях для одних и тех же массивов данных строится несколько моделей, чтобы ухватить их характеристики разных видов. Пример: имеется информация от 833 датчиков движения транспорта в Чикаго. Задача состоит в автоматическом определении ситуаций, когда в транспортном потоке возникают аномалии, происходит что-то необычное (но не простая пробка!). Данные сегментировались по дням, часам и участкам дороги, что приводило к появлению 7х24х250 = 42000 автоматически генерируемых статистических моделей - хотелось бы значительно сократить их число! Подобная ситуация возникает и в онлайновом маркетинге (отдельная модель поведения для каждого клиента), в перспективных подходах к оценке эффективности лекарств на основе индивидуального генотипа и т. д. Так что миллиард набирается легко - вопрос в том, как радикально уменьшить это число.

• Разработка систем анализа текстов (text mining), способных сдать обыЧные экзамены на понимание текста SAT, GRE, GMAT (Ronen Feldman, Ронен Фелдман). Эту задачу с оптимизмом комментирует в своих ответах Григорий Пятецкий-Шапиро. Она покруче даже стандартного теста Тьюринга (определить, машина или человек отвечает на ваши вопросы), по поводу которого тоже было много оптимизма, в том числе и у его гениального автора. Однако не будем забывать, что этот вызов - лишь планка, которую автор предложения поднимает так высоко в надежде на достижение более приземленных практических целей: довести точность реализации реляционных запросов с нынешних 70–80% до 98–100%, причем в самой общей ситуации.

Кроме этого, был предложен еще один весьма важный вызов - функциональная аннотация белков. Однако формулировка здесь так сложна, а задач так много, что мы ограничимся лишь констатацией - это направление, датамайнинг в геномике и протеомике, тоже служит источником великих вызовов (напомним, кстати, что недавно назначен приз X PRIZE за снижение стоимости сканирования генома до 10 тысяч долларов при повышении производительности до ста геномов за десять дней).

Ну а для полноты картины упомянем и конкурс, который состоится на конференции KDD-2007. Участникам предоставляется тренировочный массив данных Netflix, в котором собрано больше 100 млн. рейтингов (по пятибалльной шкале) по 18 тысячам фильмов от 480 тысяч случайно выбранных анонимных пользователей Netflix (то есть людей, бравших у Netflix DVD напрокат), с 1998 по 2005 год. Вот одна из двух задач, по которым будет проводиться состязание:

Дан список из 100 тысяч пар вида "номер_пользователя, номер_фильма", относящийся к 2006 году (то есть не входящий в тренировочный массив). Для каждой такой пары нужно указать вероятность, что данный пользователь хоть как-то рейтинговал данный фильм в 2006 году.

Денежные призы не предусмотрены - в отличие от основного конкурса Netflix. Там, чтобы заработать миллион долларов, требуется превзойти точность действующей сейчас на фирме системы рекомендаций Cinematch™ всего лишь на 10% (на исторических данных); ежегодно разыгрывается приз в скромные 50 тысяч долларов просто за самое большое уточнение прогноза. Прогноз состоит в том, чтобы угадать по предшествующим оценкам фильмов клиентами, какие из фильмов они высоко оценят в будущем. По состоянию на 14 марта 2007 года лучший результат в конкурсе Netflix уже 6,75%, то есть две трети пути к миллиону пройдено.

ЦИФРА ЗАКОНА: Письмо несчастья: Может ли "покаянное письмо" спасти системного администратора?

Автор: Павел Протасов

Среди обилия заблуждений, бродящих по умам наших соотечественников, одно из первых мест занимают те, что связаны с законодательством. Об одном из них я и хочу сейчас поговорить. Оно периодически всплывает то тут, то там в ходе разнообразных обсуждений судьбы тех бедолаг, что попали под кампанию борьбы нашего государства с пиратством, однако наиболее активно его начали пропагандировать в связи с недавним судебным процессом по обвинению в "пиратстве" директора сельской школы Александра Поносова. Связано оно с вопросом о том, как обезопасить себя от милицейского "наезда", если на вверенной абстрактному системному администратору территории обнаружилось что-то контрафактное.

Директор школы Поносов - все-таки исключение, а типичной является ситуация, когда за "пиратку" привлекают к ответственности компьютерных дел мастера, обслуживающего какую-нибудь контору. В один прекрасный день приходит проверка, которая обнаруживает на конторских компьютерах пиратские программы и интересуется: а кто же их установил. Такой человек находится довольно быстро, а поскольку речь идет об организации и компьютеров несколько, то контрафакта на "уголовный" размер обычно набирается. Следствие, суд, условный срок, заметка в местной газете об очередной победе борцов с высокими технологиями и о вреде пиратства. Стандартный набор.

Правда, сперва я хочу испортить вам удовольствие от предвкушения развязки этой статьи и дать искомый ответ в самом начале. Он прост: чтобы избежать ответственности за "пиратство", не нужно ставить ничего "пиратского". А теперь - можете читать дальше.

"Отмазка" найдена?

Пальму первенства в дискуссиях о том, как выйти сухим из воды, удерживает предложение обратиться к вышестоящему начальству с письмом и предупредить о недопустимости использования на рабочих местах контрафакта. Следует вручить оное письмо под роспись и наслаждаться жизнью. Дающие такой совет уверены, что это позволит переложить ответственность на начальника, оставив непосредственного исполнителя чистым. Вот на этом устойчивом и вредном заблуждении я бы и хотел остановиться поподробнее.

Вообще, склонность соотечественников давать советы в тех областях, в которых они ничего не соображают, меня всегда поражала. Любопытно, много ли из советчиков пытались применить этот прогрессивный метод на практике? Боюсь, таковых не обнаружится. А если и обнаружатся, то чутье подсказывает, что о встрече с милицией, которой было предъявлено такое письмо, предъявлявший предпочтет не вспоминать очень долго.

Давайте посмотрим, как, собственно, происходит привлечение к уголовной ответственности. Следствию необходимо, среди прочего, доказать умысел подозреваемого на совершение преступления, то есть подтвердить его осведомленность о том, что устанавливаемые программы - контрафактные, и сознательно желание их установить. Тут есть несколько способов.

Самый простой - сотрудники милиции приходят "побеседовать" с руководством организации. "Беседой" это мероприятие называется исключительно в протоколах, а к чему его отнести с точки зрения повседневного лексикона - даже и не знаю. В "Крестном отце" было такое выражение: "предложение, от которого невозможно отказаться", - вот, очень подходит… Во время "беседы" делается предупреждение о недопустимости использования нелицензионного софта, причем под расписку. Если вас навестили такие вот "собеседники" - пора переводить свой компьютерный парк под "Линукс". Ибо времени осталось совсем мало. Неизбежно нагрянет следующая проверка, после которой может быть возбуждено уголовное дело. И в деле этом будет фигурировать расписка о том, что вы соответствующим образом предупреждены…

1 ... 16 17 18 19 20 21 22 23 24 ... 26

Перейти на страницу:

Тут вы можете бесплатно читать книгу Журнал «Компьютерра» № 11 от 20 марта 2007 года - Компьютерра.

Пожаловаться на ошибку